PowerQuery


Power Query et son interface permettent de réaliser facilement des transformations simples.   En programmant en langage M, nous pouvons réaliser des transformations plus complexes, mais il faut bien reconnaître que la difficulté dans la programmation devient vite prohibitive. Microsoft l’a semble-t-il bien compris, en intégrant le langage R à Power Bi. Ce langage, utilisé par les data scientists du monde entier, permet de réaliser ces opérations bien plus facilement. Pour utiliser R dans Power Query, vous devrez tout d’abord mettre en place l’environnement sur votre ordinateur. Une fois l’environnement installé, nous allons devoir installer un package R nommé ‘dplyr’ Ouvrez R studio Tapez Fermez Rstudio Voila c’est fait ! Maintenant nous pouvons créer une nouvelle requête dans Power BI : Obtenir les données Web Entrez cette Url : https://raw.githubusercontent.com/genomicsclass/dagdata/master/inst/extdata/msleep_ggplot2.csv Modifier. Transformer –> Utiliser la première ligne pour les entêtes. Sélectionnez les colonnes contenant des chiffres et transformez leur type en Décimal. Normalement vous devriez obtenir ceci :   Maintenant nous allons pouvoir créer une nouvelle étape de transformation en créant un script R.     Copiez-collez ce script : Cliquez sur Ok   Ce script permet d’afficher les six premières lignes du Dataset et de l’affecter à la variable […]

Power Query & R – Transformation avec Dplyr



Il peut être utile (pour documenter une base de données ou visualiser la structure d’un nouveau dataset) d’obtenir un descriptif d’un table. Si vous êtes familiers de R vous connaissez la fonction str(dataset). Avec M et powerquery, nous pouvons obtenir un résultat voisin, en utilisant la fonction Table.Schema(). Dans cet exemple, nous avons référencé la requête iris comme source de données de la seconde requête. Cette dernière nous donne un descriptif de la structure du dataset iris. Pour aller plus loin, nous pouvons utiliser la fonction Table.Profile() qui nous fournira un ensemble de statistiques descriptives sommaires pour chaque critère (similaire à la fonction summary() dans R.) Cette fonction est très utile pour identifier la distribution des données, la volumétrie, les normalisations à réaliser etc…

PowerQuery – Decrire facilement des tables