Azure ML, Importer et exporter des données


Cet article fait partie d’une série de posts destinés à expliquer le fonctionnement de Azure ML.

Vous pouvez retrouver les précédents articles en cliquant sur ces liens:

 

ML Studio permet d’importer des données de différents formats, provenant de différentes sources.

Importer depuis votre PC

 

Dans l’écran Expérience cliquez sur New.

 

Puis sur Dataset–>From local file.

 

Choisissez votre fichier et son extension, et choisissez un nom pour le Dataset (il doit être unique, utilisez un numéro additionnel pour les versions.)

 

Une fois le Dataset chargé, ML Studio nous indique ce message :

Cliquez sur Ok pour terminer le téléchargement.

 

Le Dataset est alors accessible dans le menu My Datasets.

 

Vous pouvez aussi cliquer sur  Datasets dans le menu de gauche.

 

Entrer des données manuellement

 

 

Il est possible d’entrer des données manuellement, en déposant le module Enter Data Manually, sur le canvas, puis en saisissant les données dans la fenêtre de droite.

 

 

Utiliser le modules d’import des données.

 

Le module Import Data permet d’acquérir des données en provenance de différentes sources.

Tout d’abord placez le module sur le canvas, puis sélectionnez la source de données, dans la fenêtre de droite.

 

Importer du web

On peut importer un dataset du web en précisant son URL dans la fenêtre de droite.

Cette URL peut suivre un protocole HTTP/HTTPS/FTP ou FTPS.

Entrez l’URL suivante, par exemple :

http://archive.ics.uci.edu/ml/machine-learning-databases/forest-fires/forestfires.csv

Sans oublier de cocher l’option pour le Header.

 

Lancez l’expérience et visualisez le résultat :

 

Importer des données d’Azure.

ML Studio vous permet d’importer de trois sources différentes :

Pour les données NoSql :

  • Azure Blob
  • Azure Table

Par exemple pour Azure blob :

 

Renseignez l’URL suivante :

https://azuremlsampleexperiments.blob.core.windows.net/datasets/student_performance.txt

Sauvegardez le Dataset (clic droit sur le port de sortie – Save as Dataset) sous le nom Student Data.

Pour les données Sql

  • Azure SQL Database
  • Azure cosmos Database

 

Importer d’autres sources

  • Data feed  (Odata)
  • Hive query
  • On premises SQL Database

 

Conversion de données

ML Studio offre la possibilité de convertir un Dataset dans un autre format.

Le module Convert to CSV permet, de plus de sauvegarder le Dataset dans Mes Dataset pour une ré-utilisation dans une autre expérience.

 

Sauvegarder les Datasets

 

Il est possible de sauvegarder le Dataset dans « Mes datasets » pour le rendre accessible dans d’autres expériences, directement depuis ML Studio, ou de télécharger le Dataset sur votre disque dur.

 

 

Exporter le Dataset vers d’autres systèmes.

Il est possible d’utiliser le module Export Data pour sauvegarder votre Dataset Azure Blob, Azure Table, Azure SQL Database ou Hadoop file system (via Hive query.)

 

Dans cet article vous avez vu comment importer et exporter des données dans et depuis Azure ML.

Vous êtes désormais en mesure de procéder à la prochaine étape : La préparation des données.

 

 

Laissez un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *