Dataframes


Dans cet article, nous allons voir comment réaliser des opérations simples en utilisant un script R dans power query. Pour générer une table de données nous allons devoir créer ce que se nomme un dataframe, dans le langage R. Un dataframe est utilisé pour stocker les tables de données, elles-mêmes constituées de colonnes (ou vecteurs en R), de même longueur. En R, la notation pour un vecteur est c(). c(1,2,3) représente donc une colonne de données dont les valeurs des lignes sont 1,2 et 3. Pour affecter un vecteur à une variable, nous pouvons utiliser le signe = ou la notation <-. x = c(1,2,3) x <- c(1,2,3) Pour afficher le résultat sous forme de table, dans Power query, nous devrons utiliser la fonction data.frame(). n = c(2, 3, 5) df = data.frame(n) Ce qui donne dans l’éditeur de powerquery, le code suivant : let Source = R.Execute(« df=c(2,3,5);dataset=data.frame(df) »), dataset = Source{[Name= »dataset »]}[Value] in dataset La constitution d’une table suit la même logique : a = c(3, 4, 5) b = c(« aa », « bb », « cc ») c = c(TRUE, FALSE, TRUE) df = data.frame(a, b, c) Une colonne du dataframe peut aussi être le fruit d’un calcul comme : a = c(3, 4, 5) […]

Power Query – Script R – Créer une table de ...