Archives du jour : 16 avril 2019


Cet article fait partie d’une série de posts destinés à expliquer le fonctionnement de Azure ML. Vous pouvez retrouver les précédents articles en cliquant sur ces liens: http://www.netdaf.com/introduction-au-machine-learning/ http://www.netdaf.com/azure-ml-premiere-experience/ http://www.netdaf.com/azure-ml-importer-et-exporter-des-donnees/     Les données à analyser auront le plus souvent besoin d’être préparées, pour pouvoir être traitées par les algorithmes de ML. L’interface graphique de ML Studio procure les outils de base pour réaliser ces tâches.   Lorsque ces outils se révèlent insuffisants il reste possible d’utiliser des scripts R ou Python.     Traiter les données manquantes     Cette tâche fait partie des plus communes en Data Science et ML. Lorsque des valeurs manquent, il faudra soit supprimer les lignes ou colonnes contenant ces valeurs manquantes, soit remplacer ces dernières par une valeur arbitraire (moyenne, médiane,valeur personnalisée,valeur probalisée.)   La première étape consiste à visualiser votre Dataset pour identifier les colonnes contenant des valeurs manquantes.     Puis déposer un module Clean missing Data sur le Canvas, en connectant les ports, avant de sélectionner les colonnes à traiter.       Comme le traitement s’effectue par colonne, ML Studio offre la possibilité de borner le nombre de valeurs manquantes conditionnant l’exécution du traitement :   Nombre de valeurs manquantes minimum […]

Azure ML, préparer les données