Power Query – Agréger des tables


Les utilisateurs d’Excel sont familiers des tâches répétitives :

  • Ouvrir deux fichiers
  • Transformer les données
  • Copier-coller pour agréger les deux fichiers

 

Et ce, tous les mois, toutes les semaines ou tous les jours…

 

Power Query nous permet d’automatiser ce processus, tout en évitant au passage les erreurs humaines.

Si ce n’est déjà fait, vous pouvez télécharger les fichiers sources sur le site de l’excellent  livre M is for (Data) Monkey écrit par Ken Puls et Miguel Escobar  dont nous nous sommes inspiré Télécharger les fichiers pour écrire ce post.

Importation

 

Le processus est simple :

 – Allez au menu    Obtenir les données –> Texte/CSV

Un fois les données importées, nous constatons, dans le volet de droite que Power Query a automatiquement généré deux étapes :

  • La promotion des entêtes
  • La transformation des types de données

 

Comme vous pouvez le constater, la colonne ‘amount’ doit être convertie en nombre décimal.

Si vous tentez de le faire directement, cela générera une erreur, car les paramètres locaux ne reconnaissent pas le format.

La solution consiste à modifier le type, en utilisant les paramètres régionaux.

Et en choisissant nombre décimal –> Anglais (Etats unis)

Vous pouvez maintenant répéter l’opération pour le champs Date.

Ensuite, nous devons supprimer les lignes qui contiennent des erreurs (par exemple celles qui contiennent une valeur non compatible avec le format date.)

 

Enfin, renommez les colonnes en faisant clic droit sur leurs entêtes.

Voici à quoi devrait ressembler votre table :

Chargez la table (bouton fermer et appliquer), puis recommencez le processus avec les fichiers pour février et mars.

Une astuce pour gagner du temps consiste à dupliquer votre requête :

Ensuite, renommez cette requête en Feb 2008.

Puis enfin, changez le chemin d’accès au fichier CSV, en cliquant sur la petite roue située à droite de source, dans le volet des étapes.

Vous devez maintenant avoir trois tables dans votre modèle de données.

 

L’objectif, va consister à fusionner ces trois tables.

Pour ce faire, cliquez sur modifier les requêtes

Cliquez sur votre requête Mar 2008, puis sur

  • combiner –> Ajouter des requêtes –> comme étant nouvelles.

 

 

 

Cliquez sur

 – Au moins trois tables

 Ajoutez les tables et enfin validez.

Renommez la requête sous le nom « Ventes » puis chargez le tout.

Vous devez maintenant avoir quatre tables dans votre modèle de données.

Nous pouvons vérifier que notre table des ventes comprend bien les trois tables, agrégées, en représentant graphiquement le cumul des montants, dans une carte.

Pour que l’agrégation se passe bien, il est important que les entêtes de colonne portent le même nom.

Pour s’en rendre compte, il nous suffit de modifier l’une des requêtes, en modifiant par exemple le nom de la colonne ‘Montant’ en ‘Test’, dans la requête Fev 2008.

Lorsque l’on charge la table, on comprend la manière dont Power Query a réglé le problème.

Tout simplement en créant une nouvelle colonne ‘Test’ et en y insérant les valeurs de l’ex colonne ‘Montant’, pour le mois de février.

Dans le même temps, les enregistrements de la colonne ‘Montant’ ont été renseignés par la valeur ‘null’.

Laissez un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *