ML Studio


Cet article fait partie d’une série de posts destinés à expliquer le fonctionnement de Azure ML. Vous pouvez retrouver les précédents articles en cliquant sur ces liens: http://www.netdaf.com/introduction-au-machine-learning/ http://www.netdaf.com/azure-ml-premiere-experience/ http://www.netdaf.com/azure-ml-importer-et-exporter-des-donnees/ http://www.netdaf.com/azure-ml-preparer-les-donnees/ http://www.netdaf.com/azure-ml-preparation-avancee-des-donnees/   Les modèles de régression sont utilisés pour prédire une valeur pour une variable cible (par exemple le prix de revente d’une voiture) en fonction de critères (Age du véhicule, nombre de Kms, état général etc..)   Les critères sont nommés variables dépendantes, alors que la variable cible est la variable indépendante ou label.   L’objectif est de créer un modèle qui prendra les critères en entrée et prédira la valeur de revente du véhicule.   Ce modèle peut être envisagé comme une fonction du type : f(critère1,critère2…..) =  Valeur de revente.   Le prix réel auquel ce véhicule peut être vendu sera le plus souvent différent du prix prédit par la fonction.   L’objectif du modèle est de minimiser l’écart Réel-Prédiction.   Pour créer un modèle de ce type, nous allons tout d’abord avoir besoin d’un Dataset comprenant des données historiques de ventes de véhicules, que nous nommerons Dataset d’entrainement.   Ce Dataset d’entrainement va nourrir l’algorithme de régression et va lui permettre de créer un modèle.   […]

Azure ML : Modèles de régression



Cet article fait partie d’une série de posts destinés à expliquer le fonctionnement de Azure ML. Vous pouvez retrouver les précédents articles en cliquant sur ces liens: http://www.netdaf.com/introduction-au-machine-learning/ http://www.netdaf.com/azure-ml-premiere-experience/ http://www.netdaf.com/azure-ml-importer-et-exporter-des-donnees/ http://www.netdaf.com/azure-ml-preparer-les-donnees/ Supprimer les valeurs aberrantes.   Les valeurs aberrantes sont des valeurs qui sont très éloignées de la masse des valeurs du Dataset,en les conservant on peut fausser les résultats des algorithmes.   Il est judicieux de traiters ces valeurs, soit en les supprimant purement et simplement, soit en les modifiant.   Le module Clip Values permet de détecter ces valeurs, en sélectionnant les colonnes à analyser,puis de les supprimer ou  de les modifier.     Normalisation   De nombreux algorithmes fonctionnent mieux lorsque les données de l’ensemble des colonnes, sont à la même échelle. Lorsqu’il existe de grandes différences dans les ordres de grandeur entre les colonnes (par exemple une colonne avec des valeurs s’étendant de 0 à 10 et une autre avec une plage de 10 000 à 10 000 000), il sera nécessaire normaliser les données.   Pour procéder à cette normalisation, il faut utiliser le module Normalize Data.     Vous pouvez sélectionner les colonnes à normaliser, par type de valeurs ou par sélection simple, puis choisir […]

Azure ML : Préparation avancée des données



Comme nous l’avons vu dans l’ introduction, tout travail en ML suit un processus bien défini.     Ce processus se réalise au sein d’une expérience, dans ML Studio. Clickez sur New, puis sur Blank experience.     Nommez l’expérience « Expérience 1« , puis deroulez le module Saved Datasets, avant de placer le dataset Adult Census Income Binary sur le canvas.       Repliez Saved Datasets, dépliez Statistical functions et placez un module Summarize Data sur le canvas. Reliez le port de sortie du dataset, au port d’entrée du module statistique. Cliquez sur RUN. Une fois les deux modules au vert, faites clic droit sur le port de sortie du module statistique pour observer le résultat.       Ce module nous permet d’identifier le nombre de variables (colonnes du Dataset:15) et le nombre de mesures statistiques réalisées sur chacune d’entre-elles (23). Ces mesures permettent de déterminer notamment le nombre d’observations, le nombre de valeurs manquantes, les valeurs minimales et maximales, la moyenne, la médiane, le mode et la distribution statistique. Une fois l’experience lancée elle s’enregistre automatiquement. Cette expérience est intégrée à un espace de travail, auquel nous allons pouvoir convier de nouveaux utilisateurs.     Vous avez maintenant une […]

Azure ML, Première expérience