AI


Cet article fait partie d’une série de posts destinés à expliquer le fonctionnement de Azure ML. Vous pouvez retrouver les précédents articles en cliquant sur ces liens: http://www.netdaf.com/introduction-au-machine-learning/ http://www.netdaf.com/azure-ml-premiere-experience/ http://www.netdaf.com/azure-ml-importer-et-exporter-des-donnees/     Les données à analyser auront le plus souvent besoin d’être préparées, pour pouvoir être traitées par les algorithmes de ML. L’interface graphique de ML Studio procure les outils de base pour réaliser ces tâches.   Lorsque ces outils se révèlent insuffisants il reste possible d’utiliser des scripts R ou Python.     Traiter les données manquantes     Cette tâche fait partie des plus communes en Data Science et ML. Lorsque des valeurs manquent, il faudra soit supprimer les lignes ou colonnes contenant ces valeurs manquantes, soit remplacer ces dernières par une valeur arbitraire (moyenne, médiane,valeur personnalisée,valeur probalisée.)   La première étape consiste à visualiser votre Dataset pour identifier les colonnes contenant des valeurs manquantes.     Puis déposer un module Clean missing Data sur le Canvas, en connectant les ports, avant de sélectionner les colonnes à traiter.       Comme le traitement s’effectue par colonne, ML Studio offre la possibilité de borner le nombre de valeurs manquantes conditionnant l’exécution du traitement :   Nombre de valeurs manquantes minimum […]

Azure ML, préparer les données



Cet article fait partie d’une série de posts destinés à expliquer le fonctionnement de Azure ML. Vous pouvez retrouver les précédents articles en cliquant sur ces liens: http://www.netdaf.com/introduction-au-machine-learning/ http://www.netdaf.com/azure-ml-premiere-experience/   ML Studio permet d’importer des données de différents formats, provenant de différentes sources. Importer depuis votre PC   Dans l’écran Expérience cliquez sur New.   Puis sur Dataset–>From local file.   Choisissez votre fichier et son extension, et choisissez un nom pour le Dataset (il doit être unique, utilisez un numéro additionnel pour les versions.)   Une fois le Dataset chargé, ML Studio nous indique ce message : Cliquez sur Ok pour terminer le téléchargement.   Le Dataset est alors accessible dans le menu My Datasets.   Vous pouvez aussi cliquer sur  Datasets dans le menu de gauche.   Entrer des données manuellement     Il est possible d’entrer des données manuellement, en déposant le module Enter Data Manually, sur le canvas, puis en saisissant les données dans la fenêtre de droite.     Utiliser le modules d’import des données.   Le module Import Data permet d’acquérir des données en provenance de différentes sources. Tout d’abord placez le module sur le canvas, puis sélectionnez la source de données, dans la […]

Azure ML, Importer et exporter des données



Comme nous l’avons vu dans l’ introduction, tout travail en ML suit un processus bien défini.     Ce processus se réalise au sein d’une expérience, dans ML Studio. Clickez sur New, puis sur Blank experience.     Nommez l’expérience « Expérience 1« , puis deroulez le module Saved Datasets, avant de placer le dataset Adult Census Income Binary sur le canvas.       Repliez Saved Datasets, dépliez Statistical functions et placez un module Summarize Data sur le canvas. Reliez le port de sortie du dataset, au port d’entrée du module statistique. Cliquez sur RUN. Une fois les deux modules au vert, faites clic droit sur le port de sortie du module statistique pour observer le résultat.       Ce module nous permet d’identifier le nombre de variables (colonnes du Dataset:15) et le nombre de mesures statistiques réalisées sur chacune d’entre-elles (23). Ces mesures permettent de déterminer notamment le nombre d’observations, le nombre de valeurs manquantes, les valeurs minimales et maximales, la moyenne, la médiane, le mode et la distribution statistique. Une fois l’experience lancée elle s’enregistre automatiquement. Cette expérience est intégrée à un espace de travail, auquel nous allons pouvoir convier de nouveaux utilisateurs.     Vous avez maintenant une […]

Azure ML, Première expérience