Azure ML


Cet article fait partie d’une série de posts destinés à expliquer le fonctionnement de Azure ML. Vous pouvez retrouver les précédents articles en cliquant sur ces liens: http://www.netdaf.com/introduction-au-machine-learning/ http://www.netdaf.com/azure-ml-premiere-experience/ http://www.netdaf.com/azure-ml-importer-et-exporter-des-donnees/ http://www.netdaf.com/azure-ml-preparer-les-donnees/ http://www.netdaf.com/azure-ml-preparation-avancee-des-donnees/   Les modèles de régression sont utilisés pour prédire une valeur pour une variable cible (par exemple le prix de revente d’une voiture) en fonction de critères (Age du véhicule, nombre de Kms, état général etc..)   Les critères sont nommés variables dépendantes, alors que la variable cible est la variable indépendante ou label.   L’objectif est de créer un modèle qui prendra les critères en entrée et prédira la valeur de revente du véhicule.   Ce modèle peut être envisagé comme une fonction du type : f(critère1,critère2…..) =  Valeur de revente.   Le prix réel auquel ce véhicule peut être vendu sera le plus souvent différent du prix prédit par la fonction.   L’objectif du modèle est de minimiser l’écart Réel-Prédiction.   Pour créer un modèle de ce type, nous allons tout d’abord avoir besoin d’un Dataset comprenant des données historiques de ventes de véhicules, que nous nommerons Dataset d’entrainement.   Ce Dataset d’entrainement va nourrir l’algorithme de régression et va lui permettre de créer un modèle.   […]

Azure ML : Modèles de régression



Cet article fait partie d’une série de posts destinés à expliquer le fonctionnement de Azure ML. Vous pouvez retrouver les précédents articles en cliquant sur ces liens: http://www.netdaf.com/introduction-au-machine-learning/ http://www.netdaf.com/azure-ml-premiere-experience/ http://www.netdaf.com/azure-ml-importer-et-exporter-des-donnees/ http://www.netdaf.com/azure-ml-preparer-les-donnees/ Supprimer les valeurs aberrantes.   Les valeurs aberrantes sont des valeurs qui sont très éloignées de la masse des valeurs du Dataset,en les conservant on peut fausser les résultats des algorithmes.   Il est judicieux de traiters ces valeurs, soit en les supprimant purement et simplement, soit en les modifiant.   Le module Clip Values permet de détecter ces valeurs, en sélectionnant les colonnes à analyser,puis de les supprimer ou  de les modifier.     Normalisation   De nombreux algorithmes fonctionnent mieux lorsque les données de l’ensemble des colonnes, sont à la même échelle. Lorsqu’il existe de grandes différences dans les ordres de grandeur entre les colonnes (par exemple une colonne avec des valeurs s’étendant de 0 à 10 et une autre avec une plage de 10 000 à 10 000 000), il sera nécessaire normaliser les données.   Pour procéder à cette normalisation, il faut utiliser le module Normalize Data.     Vous pouvez sélectionner les colonnes à normaliser, par type de valeurs ou par sélection simple, puis choisir […]

Azure ML : Préparation avancée des données



Cet article fait partie d’une série de posts destinés à expliquer le fonctionnement de Azure ML. Vous pouvez retrouver les précédents articles en cliquant sur ces liens: http://www.netdaf.com/introduction-au-machine-learning/ http://www.netdaf.com/azure-ml-premiere-experience/   ML Studio permet d’importer des données de différents formats, provenant de différentes sources. Importer depuis votre PC   Dans l’écran Expérience cliquez sur New.   Puis sur Dataset–>From local file.   Choisissez votre fichier et son extension, et choisissez un nom pour le Dataset (il doit être unique, utilisez un numéro additionnel pour les versions.)   Une fois le Dataset chargé, ML Studio nous indique ce message : Cliquez sur Ok pour terminer le téléchargement.   Le Dataset est alors accessible dans le menu My Datasets.   Vous pouvez aussi cliquer sur  Datasets dans le menu de gauche.   Entrer des données manuellement     Il est possible d’entrer des données manuellement, en déposant le module Enter Data Manually, sur le canvas, puis en saisissant les données dans la fenêtre de droite.     Utiliser le modules d’import des données.   Le module Import Data permet d’acquérir des données en provenance de différentes sources. Tout d’abord placez le module sur le canvas, puis sélectionnez la source de données, dans la […]

Azure ML, Importer et exporter des données