Power Query – Script R – Dataframes


Le Dataframe est l'objet que vous manipulerez le plus avec R et certainement avec Power Query, car ce dernier ne reconnaît que l'objet Dataframe (les autres objets comme les vecteurs doivent être convertis en Dataframes pour être exploités par Power Query).

Un Dataframe correspond à un table de données, chaque colonne représentant une variable avec un type de données homogène.

Contrairement aux matrices, les colonnes des dataframes peuvent être de type différent les unes des autre (numériques, logiques, texte...)

R contient un ensemble de dataframes pré-constitués, très faciles à utiliser.

  • data(mtcars);df = mtcars

Charge le dataframe mtcars.

Pour rappel les instructions doivent être saisies dans l'éditeur de la source de données Script R.
Dans l'éditeur avancé utiliser le schéma suivant :

Let
Source= R.Execute("Votre Code R")
In
Source

Nous pouvons examiner les premières ou dernières lignes du dataframe en utilisant les fonctions head() ou tail().

  • df = head(mtcars)
  • df= tail(mtcars)

 

Il est possible aussi de créer ses propres dataframes à partir d'un ensemble de vecteurs et de la fonction data.frame():

  • nom <- c("Mercure", "Venus", "Terre", "Mars", "Jupiter", "Saturne",                       "Uranus", "Neptune");


    type <- c("Terrestre", "Terrestre","Terrestre", "Terrestre", "Gazeuse                        géante", "Gazeuse géante", "Gazeuse géante", "Gazeuse                     géante");


    diamètre <- c(0.382, 0.949, 1, 0.532, 11.209, 9.449, 4.007, 3.883);


    rotation <- c(58.64, -243.02, 1, 1.03, 0.41, 0.43, -0.72, 0.67);


    anneaux <- c(FALSE, FALSE, FALSE, FALSE, TRUE, TRUE, TRUE,                                TRUE);

     

    planète_df <- data.frame(nom,type,diamètre,rotation,anneaux)

 

Nous pouvons opérer des sélections dans ce dataframe en utilisant les crochets [lignes,colonnes] :

  • df <- data.frame(planète_df[1,2])

Sélectionnera la première ligne de la deuxième colonne.

  • df <- data.frame(planète_df[5,])

Sélectionnera la 5 ème ligne entière.

Il est aussi possible de sélectionner une colonne par son nom :

  • df <- data.frame(planète_df[1:3,"nom"])

Pour sélectionner une colonne nous pouvons aussi utiliser le signe $ :

  • df <- data.frame(planète_df$nom[1:3])

Produira le même résultat que précédemment.

 

Nous pouvons aussi utiliser la fonction subset() pour réaliser une sélection dans le dataset :

  • df=subset(planète_df,type="Terrestre",diamètre<3)

 

Enfin, nous pouvons réaliser des sélections complexes en utilisant des vecteurs entre crochets:

data.frame(planète_df[c(1,3),c(1,3,4)])

Sélectionnera les lignes 1 et 3 et les colonnes 1,3 et 4 du dataset.

Laissez un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *