Transformation de données dans Power BI avec Power Query : Guide Complet pour 2024
Découvrez comment transformer vos données comme un pro sur Power BI ! Apprenez à rendre vos données claires, précises et prêtes à être analysées.
Transformer les données dans Power BI, c'est un peu comme passer du brouillon à une œuvre d'art.
Avec les bons outils et quelques astuces, tu peux rendre tes données claires, précises et super faciles à analyser.
Dans cet article, on va plonger dans les étapes essentielles de la transformation de données avec Power BI.
Que ce soit pour nettoyer des datasets, créer des relations ou personnaliser des visualisations, tu vas découvrir comment rendre tes données parlantes et prêtes à l'emploi en un rien de temps.
Allez, c'est parti pour un tour d'horizon des meilleures pratiques pour maîtriser la transformation de données dans Power BI !
Introduction à Power Query
Power Query est l'outil de transformation de données intégré à Power BI.
Il permet d'importer, de nettoyer, de transformer et d'enrichir les données avant de les charger dans le modèle de données de Power BI.
Avec une interface intuitive et des fonctionnalités robustes, Power Query est indispensable pour tout analyste de données.
Pour accéder à cette interface après avoir choisi les données à transformer, cliquez sur ‘Transformer les données’ dans l’en-tête de l’accueil.
Vous arriverez sur cette interface Power Query :
Pourquoi transformer des données ?
Transformer les données permet de les préparer pour une analyse efficace.
Cela inclut l'élimination des doublons, la correction des erreurs, le formatage des colonnes et l'ajout de nouvelles informations dérivées.
En transformant les données directement dans Power BI, on évite les allers-retours fastidieux avec Excel, ce qui économise du temps et réduit le risque d'erreurs.
{{nl-inline="/brouillon"}}
Les étapes de la transformation de données
Importation des données
La première étape consiste à importer les données dans Power BI.
Power Query prend en charge une variété de sources de données, y compris des fichiers Excel, des bases de données SQL, des services en ligne comme Google Analytics et bien d'autres.
Une fois les données importées, elles apparaissent dans l'éditeur Power Query où vous pouvez commencer à les transformer.
Exemple concret
Utilisons cet exemple de tableau Excel avec des données fictives que nous allons importer sur Power BI et utiliser pour la suite des exemples :
Cliquez sur "Obtenir les données" dans Power BI et choisissez votre source de données, comme un fichier Excel pour notre exemple.
Sélectionnez le fichier souhaité et cliquez sur "Transformer les données" pour être redirigé directement sur Power Query.
Il ne faut jamais cliquer sur le bouton ‘Charger’ après l’import des données afin de vérifier que vos données aient été bien importées. Souvent, on observe que la première ligne des en-têtes de colonne ont été décalées d’une ligne.
Les données s'affichent dans l'éditeur Power Query, prêtes à être transformées.
{{cours-gratuit-power-bi="/brouillon"}}
Nettoyage des données
Le nettoyage des données est essentiel pour garantir la qualité des analyses.
Cela inclut la suppression des lignes ou des colonnes inutiles, la correction des valeurs incorrectes et la gestion des valeurs manquantes.
Exemple concret
Supposons que votre colonne "Prix unitaire" présente sur la table ait des valeurs manquantes.
Sélectionnez la colonne "Prix" > Cliquez sur "Remplacer les valeurs" et remplacez les valeurs nulles par une moyenne calculée ou une valeur par défaut.
Transformation et enrichissement des données
Cette étape consiste à modifier la structure des données pour les rendre plus utiles.
Vous pouvez créer de nouvelles colonnes, changer les types de données, pivoter ou dé-pivoter des tables, et combiner des ensembles de données.
Exemple concret
Imaginons qu’avec la colonne "Date de vente", vous souhaitiez créer une nouvelle colonne "Mois de vente".
Utilisez la fonction "Colonne dérivée" pour extraire le mois de la date de vente : Cliquez sur "Ajouter une colonne" > "Colonne personnalisée" et utilisez la formule ‘= Date.Month([Date de vente])’.
Techniques avancées de transformation
Fusion et Append
La fusion (Merge) et l’ajout (Append) de requêtes sont deux techniques avancées pour combiner des ensembles de données.
La fusion permet de joindre deux tables sur une ou plusieurs colonnes communes, tandis que l’ajout de requêtes permet de combiner deux tables avec des colonnes similaires.
Exemple concret
Vous avez deux tables, "Ventes 2023" et "Ventes 2024", contenant les mêmes noms d’en-tête de colonne.
Pour les fusionner, utilisez "Combiner des requêtes" : Cliquez sur "Accueil" > "Fusionner des requêtes" > Sélectionnez les tables "Ventes 2023" et "Ventes 2024".
Pour ajouter une nouvelle requête, utilisez ‘Ajouter des requêtes’ > sélectionner l’autre table qui vous concerne, ici ‘Ventes 2024’.
Ainsi, les lignes présentes sur la table ‘Ventes 2024’ qui ne sont pas présentes sur la table ‘Ventes 2023’ ont été ajoutées sur la première table. Pour nous, cela correspond aux ventes réalisées en 2024
L’astuce ici est ainsi de renommer la table ‘Ventes 2023’ en ‘Ventes 2023 / 2024’, en faisant un clic-droit sur la requête, puis de ‘désactiver le chargement’ de la requête (de la table) ‘Ventes 2024’, afin que, par la suite, nous n’ayons plus à utiliser la tables avec les dates de 2024.
Groupement et agrégation
Le groupement permet de regrouper les données sur une ou plusieurs colonnes et d'effectuer des calculs d'agrégation comme les sommes, moyennes ou comptes.
Exemple concret
Si vous voulez connaître les ventes totales par région, utilisez la fonction "Regrouper par" sur la colonne "Région".
Cliquez sur "Transformer" > "Regrouper par", sélectionnez la colonne "Région" et ajoutez une nouvelle agrégation en sélectionnant "Somme" pour la colonne "Revenus".
Ainsi, nous aurons nos ventes totales regroupées par région.
Utilisation des colonnes calculées
Les colonnes calculées permettent de créer de nouvelles colonnes basées sur des formules DAX (Data Analysis Expressions).
Ces colonnes peuvent inclure des calculs simples ou complexes et sont recalculées chaque fois que les données sous-jacentes changent.
Exemple concret
Pour calculer une colonne "Profit" à partir des colonnes "Revenus" et "Coûts", utilisez la formule DAX : ‘Profit = Revenus - Coûts’.
Pour cela, il faudra retourner sur l’interface Power BI en cliquant sur ‘Fermer et appliquer’.
Ensuite, cliquez sur "Modélisation" > "Nouvelle colonne" et entrez la formule suivante :
Best practices pour la transformation de données
Maintenir la traçabilité des transformations
Documenter chaque étape de la transformation est crucial pour comprendre et répliquer le processus.
Power Query permet de visualiser chaque étape dans le volet "Étapes appliquées" dans la partie droite de l’interface Power Query, ce qui facilite le suivi et la gestion des transformations.
De plus, vous pouvez revenir en arrière sur les étapes appliquées en cliquant sur la version qui vous intéresse, ou bien supprimer l’étape qui ne vous intéresse plus en cliquant sur la croix.
Optimiser la performance des requêtes
Pour optimiser les performances, limitez le nombre de lignes et de colonnes importées, appliquez des filtres précoces pour réduire la taille des données et utilisez des requêtes de fusion optimisées.
Le chargement partiel et les transformations anticipées peuvent également améliorer la réactivité de Power Query.
Exemple concret
Appliquez des filtres dès l'importation des données pour n'inclure que les lignes nécessaires.
Dans l'éditeur Power Query, utilisez l'option "Filtrer les lignes" pour éliminer les données non pertinentes dès le départ.
Gestion des erreurs et des exceptions
La gestion des erreurs est essentielle pour garantir l'intégrité des données.
Utilisez les fonctionnalités intégrées de Power Query pour détecter et gérer les erreurs, comme les fonctions "Supprimer les erreurs" et "Remplacer les erreurs".
Il est également possible de créer des règles de validation personnalisées pour s'assurer que les données répondent à des critères spécifiques avant de les charger dans le modèle de données.
Exemples concrets
Pour supprimer les erreurs dans une colonne, sélectionnez la colonne concernée > cliquez sur "Réduire les lignes" > "Supprimer les erreurs".
Pour remplacer les erreurs par une valeur par défaut, utilisez "Remplacer les erreurs" et spécifiez la valeur de remplacement.
En bref : L'article résumé
- Transformer des données dans Power BI avec Power Query est une compétence essentielle pour tout analyste de données.
- En suivant les étapes décrites dans ce guide, vous pouvez importer, nettoyer, transformer et enrichir vos données efficacement.
- Les techniques avancées et les meilleures pratiques vous aideront à optimiser vos transformations et à garantir la qualité des données.
Pour aller plus loin et maîtriser Power BI, n'hésitez pas à consulter les formations offertes par DataBird. Elles vous permettront de développer des compétences Power Bi approfondies et de maximiser votre utilisation de Power BI.
Vous vous êtes sûrement demandé comment faire pour démêler le vrai du faux concernant l'IA en entreprise ? Rejoignez Baptiste lors de notre Data Talk pour échanger sur ce sujet captivant.
Je m'inscris