Introduction au Machine Learning


 

Microsoft parviendra-t-il à démocratiser l’usage de l’intelligence artificielle ?

 

Le développement exponentiel des capacités informatiques, a submergé le monde des affaires d’un volume considérable de données.

Que celles-ci proviennent du métier, de bases de données, de machines-outil, du web, des réseaux sociaux, ou de toute autre source, elles sont au cœur de la performance des entreprises.

Les traiter, pour les transformer en informations indispensables au pilotage des affaires, est devenu un enjeu majeur qu’il est diffcile d’ignorer.

 

Comment faire pour rester dans la course, alors que les données se multiplient et que les bons professionnels restent très rares  et coûteux ?

 

Les outils décisionnels comme Power BI, proposent des solutions graphiques permettant de limiter le recours au code, pour créer des requêtes et des mesures.

L’objectif poursuivi, est de permettre aux utilisateurs métier de créer leurs propres solutions, très rapidement, sans avoir recours aux services IT.

Le Machine Learning est une tendance récente, mais à très fort potentiel, dans le monde des solutions décisionnelles.

Avant d’entrer dans le détail du processus, il est intéressant de situer la place du Machine Learning dans cet environnement BI .

Comme on peut le voir, le Machine Learning est une technologie qui cherche à réaliser des modèle prédictifs, à répondre aux questions « Que va-t-il se passer ?, Comment cela va-t-il se passer ?, Quelle est la solution à adopter ? »

 

Si le Machine Learning (ML) est susceptible d’apporter une très grande valeur, il est aussi difficile à maîtriser avec les outils traditionnels, tels que Python et R.

Microsoft a tenté d’adresser ce problème, en poursuivant sa stratégie, qui vise à rendre les outils décisionnels accessibles aux utilisateurs finaux, sans passer par la case IT.

Azure ML Studio est aux statistiques prédictives, ce que Power BI est à la business intelligence, il fait partie de la suite Cortana Analytics.

 

Les deux outils rendent accessible ce qui était auparavant réservé à une élite technique.

 

Microsoft a créé une solution cloud, s’appuyant sur une interface graphique s’inspirant de SQL Server Integration Services. Azure ML Studio élimine une grande partie des contraintes techniques nécessaires à l’élaboration de solutions prédictives.

Il n’est plus nécessaire d’être ingénieur pour créer des modèles applicables à vos problèmes métier.

 

l’interface graphique permet d’ajouter des jeux de données (Dataset), de réaliser des transformations sur ces derniers, d’appliquer des algorithmes et de publier les modèles sous la forme de web services.

Lorsque les transformations nécessaires ne sont pas disponibles via l’interface, il est possible d’utiliser les languages R et Python pour y remédier.

 

Utiliser ML Studio

 

Tout d’abord il vous faut un compte Microsoft.

https://account.microsoft.com/account?lang=fr-ca

 

Une fois que vous avez ce compte, vous pouvez l’utiliser pour vous connecter au portail Azure, qui comprend toutes les offres Cloud de Microsoft.

https://portal.azure.com/#home

 

Cliquez sur Tous les services, puis sur IA+Machine learning, enfin sur Espaces de travail de service Machine Learning.

 

 

Cliquez sur Créer Espace de travail de service azure machine Learning.

 

 

Puis suivez la procédure d’identification.

 

Désormais, vous pourrez vous connecter directement à Azure ML en suivant ce lien :

https://studio.azureml.net/Home/

 

L’écran d’accueil permet d’accéder par le menu de gauche, aux environnements qui sont disponibles dans votre espace de travail.

  • Projets
  • Expériences
  • Web services
  • Carnets de notes
  • Datasets
  • Modèles
  • Paramètres

 

Vos travaux en ML vont devoir suivre un cheminement spécifique :

 

  • La première étape va consister à identifier votre problème spécifique (prévision de vente, segmentation de client..)
  • Ensuite, il vous faudra identifier les données disponibles, ainsi que les données qu’il faudra obtenir, pour répondre au problème.
  • Un fois les données collectées, il faudra les charger, les nettoyer, les transformer, les agréger etc..
  • Ce Dataset sera ensuite le plus souvent segmenté, en Dataset d’entrainement et Dataset de Test.
  • Il restera à choisir un ou plusieurs algorithmes adaptés à la résolution du problème, et à les connecter au Dataset d’entrainement, pour générer un modèle (Algorithme entrainé.)
  • Evaluer le modèle.
  • Recommencer le processus autant de fois que nécessaire, pour ajuster le modèle (nouvelles données, nouvel algorithme…)
  • Déployer le modèle.

Dans ML Studio ce processus se réalise au sein d’une expérience.

 

Expériences

 

Une expérience est une succession de modules, qui réalisent des tâches permettant de créer une analyse.

Chaque module dispose de zéro, un, ou de plusieurs ports d’entrée, et d’au moins un port de sortie.

 

Pour créer une nouvelle expérience, cliquez sur New en bas à gauche de l’écran :

 

 

Vous pouvez alors choisir d’utiliser les modèles existant un de créer une expérience à partir de rien (Blank experiment.)

Quand vous créez l’expérience, vous verrez l’écran suivant, qui comprend une palette de modules.

 

 

Lorsque vous cliquez sur l’un des modules (un des blocs de transformation),vous pouvez visualiser et modifier ses propriétés, dans le volet de droite.

 

Vous pouvez sauvegarder l’expérience ou la lancer, en cliquant respectivement sur save ou run.

 

Lorsque vous lancez l’expérience en cliquant sur RUN, ML Studio réalise les tâches les unes après les autres, et ajoute une coche verte lorsque la tache s’est réalisée correctement, ou une croix rouge en cas d’échec.

 

 

 

Une expérience est terminée, lorsque tous les modules sont correctement exécutés.

Lorsque l’un des modules est en échec, les autres peuvent ne pas être exécutés.

 

Il est possible de visualiser le résultat à chaque étape du processus, en effectuant un clic  sur le port de sortie du module sélectionné.

 

Cette action permet d’obtenir des informations statistiques sur le Dataset de sortie, à chaque étape du processus.

Il est aussi possible de sauvegarder ce Dataset intermédiaire, pour une utilisation ultérieure dans une autre expérience.

 

 

Les 100 premières lignes sont affichées, ainsi que le nombre de colonnes et de lignes.

En cliquant sur l’une des colonnes ,nous pouvons visualiser des statistiques de base, ainsi que la distribution graphique, dans le volet de droite.

 

Le graphique par défaut est l’histogramme, mais il est possible de visualiser la distribution des données, sous forme de boxplot en cliquant sur son icône.

 

Dans cet article vous avez pu vous faire une première idée de ce qu’est le Machine Learning, et de la solution proposée par Microsoft pour le rendre accessible au plus grand nombre. Prochainement nous créerons une expérience complète.

Laissez un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *