Agréger, lier ou réunir des données
Vous pouvez agréger, lier ou réunir vos données pour regrouper ou combiner des données à des fins d’analyse.
Remarque : Depuis la version 2020.4.1, vous pouvez désormais créer et modifier des flux dans Tableau Server et Tableau Cloud. Le contenu de cette rubrique s’applique à toutes les plateformes, sauf mention spécifique. Pour plus d’informations sur la création de flux sur le Web, consultez Tableau Prep sur le Web dans l’aide de Tableau Server(Le lien s’ouvre dans une nouvelle fenêtre) et de Tableau Cloud(Le lien s’ouvre dans une nouvelle fenêtre).
Agréger et regrouper les données
Parfois, vous devez ajuster la granularité de certaines données, soit pour réduire la quantité de données produites à partir du flux, soit pour aligner des données avec d’autres données que vous souhaitez lier ou réunir. Par exemple, vous pouvez souhaiter agréger des données de ventes par client avant de lier une table de ventes avec une table de clients.
Si vous avez besoin d’ajuster la granularité de vos données, utilisez l’option Agréger pour créer une étape d’agrégation ou de regroupement des données. Le fait que les données soient agrégées ou regroupées dépend du type de données (chaîne, nombre ou date).
Dans le volet Flux, cliquez sur l’icône plus et sélectionnez Agrégation. Une nouvelle étape d’agrégation s’affiche dans le volet Flux et le volet Profil est mis à jour pour afficher le profil d’agrégation et de groupe.
Faites glisser les champs du volet de gauche vers le volet Champs groupés (les champs qui composent la ligne) ou vers le volet Champs agrégés (les données qui seront agrégées et présentées au niveau des champs groupés).
Vous pouvez aussi :
Faire glisser et déposer des champs entre les deux volets.
Rechercher des champs dans la liste et sélectionner uniquement les champs que vous souhaitez inclure dans l’agrégation.
Double-cliquer sur un champ pour l’inclure dans le volet gauche ou droit.
Modifier la fonction du champ pour l’ajouter automatiquement au volet approprié.
Cliquer sur Ajouter tout ou Tout supprimer pour appliquer ou supprimer des champs en lots.
Appliquez certaines opérations de nettoyage aux champs. Pour plus d’informations sur les options de nettoyage disponibles, consultez À propos des opérations de nettoyage(Le lien s’ouvre dans une nouvelle fenêtre).
L’exemple suivant montrerait la somme agrégée du bénéfice et de la quantité, ainsi que la remise moyenne par région et année de vente.
Les champs sont distribués entre les colonnes Champs regroupés et Champs agrégés en fonction de leur type de données. Cliquez sur les en-têtes de type de groupe ou d’agrégation (par exemple, AVG ou SUM) pour modifier le type de groupe ou d’agrégation.
Dans les grilles de données sous le profil d’agrégation et de groupe, vous pouvez voir un échantillon des membres du groupe ou de l’agrégation.
Toutes les opérations de nettoyage exécutées sur les champs sont enregistrées dans le volet Modifications.
Lier vos données
Les données que vous analysez dans Tableau sont composées d’un ensemble de tables liées par des champs spécifiques. La jointure est une méthode permettant de combiner les données liées à ces champs communs. Le résultat de la combinaison de données à l’aide d’une jointure est une table qui s’étend généralement à l’horizontale suite à l’ajout de champs de données.
La jointure est une opération que vous pouvez effectuer en tout point du flux. La jointure à un stade précoce du flux peut vous aider à comprendre vos ensembles de données et faire apparaître les points qui nécessitent votre attention immédiate.
Tableau Prep prend en charge les types de jointure suivants :
Type de jointure | Description |
---|---|
Gauche | Pour chaque ligne, inclue toutes les valeurs de la table gauche et toutes les valeurs correspondantes de la table droite. Lorsqu’une valeur de la table gauche n’a pas de correspondance dans la table droite, vous voyez une valeur nulle dans les résultats de la jointure. |
Interne | Pour chaque ligne, inclut les valeurs qui ont des correspondances dans les deux tables. |
Droite | Pour chaque ligne, inclut toutes les valeurs de la table droite et les valeurs correspondantes de la table gauche. Lorsqu’une valeur de la table droite n’a pas de valeur correspondante dans la table gauche, vous voyez une valeur nulle dans les résultats de la jointure. |
leftOnly | Pour chaque ligne, inclut uniquement les valeurs de la table gauche qui ne correspondent à aucune valeur de la table droite. Les valeurs de champ de la table droite s’affichent sous forme de valeurs nulles dans les résultats de la jointure. |
rightOnly | Pour chaque ligne, inclut uniquement les valeurs de la table droite qui ne correspondent à aucune valeur de la table gauche. Les valeurs de champ de la table gauche s’affichent sous forme de valeurs nulles dans les résultats de la jointure. |
notInner | Pour chaque ligne, inclut toutes les valeurs de la table droite et de la table gauche qui ne correspondent pas. |
Complète | Pour chaque ligne, inclut toutes les valeurs des deux tables. Lorsqu’une valeur de l’une des tables n’a pas de correspondance dans l’autre table, vous voyez une valeur nulle dans les résultats de la jointure. |
Pour créer une jointure, procédez comme suit :
Liez deux tables à l’aide de l’une des méthodes suivantes :
- Ajoutez au moins deux tables dans le volet Flux, sélectionnez la table connexe et faites-la glisser vers l’autre table jusqu’à ce que l’option Jointure s’affiche.
- Cliquez sur l’icône et sélectionnez Ajouter une jointure dans le menu, puis ajoutez manuellement l’autre entrée à la jointure, et ajoutez les clauses de jointure.
Remarque : si vous vous connectez à une table pour laquelle des relations de tables sont définies et qui inclut des champs connexes, vous pouvez sélectionner Jointure et faire votre choix dans la liste des tables connexes. Tableau Prep crée la jointure en fonction des champs qui constituent la relation entre les deux tables.
Pour plus d’informations sur les connecteurs avec des relations de table, consultez Lier des données dans l’étape de saisie(Le lien s’ouvre dans une nouvelle fenêtre).Une nouvelle étape de jointure est ajoutée au flux et le volet Profil se met à jour de manière à afficher le profil de jointure.
Pour consulter et configurer la jointure, procédez comme suit :
Consultez Résumé des résultats de la jointure pour voir le nombre de champs inclus et exclus du fait du type de jointure et des conditions de jointure.
Dans Type de jointure, cliquez sur le graphique Venn pour spécifier le type de jointure souhaité.
Dans Clauses de jointure appliquées, cliquez sur l’icône plus ou, dans le champ choisi pour la condition de jointure par défaut, spécifiez ou modifiez la clause de jointure. Les champs que vous avez sélectionnés dans la condition de jointure sont les champs communs aux tables de la jointure.
Vous pouvez également cliquer sur les clauses de jointure recommandées qui s’affichent sous Recommandations relatives aux clauses de jointure pour ajouter la clause à la liste des clauses de jointure appliquées.
Examiner les résultats de la jointure
Le résumé affiché dans le profil de jointure présente les métadonnées sur la jointure pour que vous puissiez vérifier que la jointure inclut bien les données attendues.
Clauses de jointure appliquées : par défaut, Tableau Prep définit la première clause de jointure sur la base des noms de champs communs dans les tables à lier. Ajoutez ou supprimez les clauses de jointure selon vos besoins.
Type de jointure : par défaut, lorsque vous créez une jointure, Tableau Prep utilise une jointure interne entre les tables. Selon les données auxquelles vous vous connectez, vous pourrez peut-être utiliser les jointures gauches, internes, droites, leftOnly, rightOnly, notInner ou complètes.
Résumé des résultats de la jointure : le résumé des résultats de la jointure présente la répartition des valeurs incluses et exclues dans les tables de la jointure.
Cliquez sur chaque barre Inclus pour isoler et voir les données du profil de jointure incluses dans la jointure.
Cliquez sur chaque barre Exclu pour isoler et voir les données du profil de jointure exclues de la jointure.
Cliquez sur toute combinaison de barres Inclus et Exclu pour voir une perspective cumulée des données.
Recommandations relatives aux clauses de jointure : cliquez sur l’icône plus à côté de la clause de jointure recommandée pour l’ajouter à la liste Clauses de jointure appliquées.
Volet Clauses de jointure : dans les Clauses de jointure, vous pouvez voir les valeurs de chaque champ dans la clause de jointure. Les valeurs qui ne répondent pas aux critères de la jointure s’affichent en texte rouge.
Volet Résultats de la jointure : si, dans le volet Résultats de la jointure, vous voyez des valeurs que vous souhaitez modifier, vous pouvez modifier les valeurs dans ce volet.
Problèmes courants de jointure
Si vous ne voyez pas les résultats attendus après avoir lié vos données, vous devrez peut-être effectuer un nettoyage supplémentaire de vos valeurs de champ. Les problèmes suivants font que Tableau Prep verra les valeurs comme non correspondantes et les exclura de la jointure :
Capitalisation différente : Mes Ventes et mes ventes
Orthographe différente : Hawaii et Hawaï
Faute de frappe ou faute de saisie : Ma santé d’entreprise ou Ma santé d’entrepise
Changements de nom : Pierre Martin et Pierre Martin Jr.
Abréviations : My Company Limited et My Company Ltd
Séparateurs supplémentaires : Honolulu et Honolulu (Hawaii)
Espaces supplémentaires : par exemple, espace supplémentaire entre des caractères, espaces de tabulation ou espaces supplémentaires de début ou de fin
Utilisation incohérente des points : Retourné, inutile et Retourné, inutile.
La bonne nouvelle est que si vos valeurs de champ ne présentent aucun de ces problèmes, vous pouvez corriger les valeurs de champ directement dans les Clauses de jointure ou travailler avec les valeurs exclues en cliquant sur les barres Exclu(s) dans Résumé des résultats de la jointure et utiliser les opérations de nettoyage dans le menu du volet Profil.
Pour plus d’informations sur les différentes options de nettoyage disponibles dans l’étape Jointure, consultez À propos des opérations de nettoyage(Le lien s’ouvre dans une nouvelle fenêtre).
Corriger les champs discordants et autres options
Vous pouvez corriger les champs discordants directement dans la clause de jointure. Double-cliquez ou faites un clic droit sur la valeur et sélectionnez Modifier la valeur dans le menu contextuel du champ que vous souhaitez corriger et entrez une nouvelle valeur. Vos modifications de données sont enregistrées et ajoutées au volet Modifications à droite dans l’étape Jointure.
Vous pouvez également sélectionner plusieurs valeurs à conserver, exclure ou filtrer dans les volets Clauses de jointure, ou appliquer d’autres opérations de nettoyage dans le volet Résultats de la jointure. Selon les champs que vous modifiez et leur emplacement dans le processus de jointure, vos modifications sont appliquées soit avant, soit après la jointure pour vous fournir les résultats corrigés.
Pour plus d’informations sur le nettoyage des champs, consultez Appliquer des opérations de nettoyage(Le lien s’ouvre dans une nouvelle fenêtre).
Réunir vos données
L’union est une méthode de combinaison des données par ajout de lignes d’une table dans une autre table. Par exemple, vous pouvez souhaitez ajouter les nouvelles transactions dans une table à la liste des transactions passées dans une autre table. Assurez-vous que les tables que vous réunissez comportent le même nombre de champs et les mêmes noms de champs, et que les champs utilisent le même type de données.
Conseil : Afin de maximiser les performances, une seule union peut avoir 10 entrées au maximum. Si vous avez besoin de réunir plus de 10 fichiers ou tables, essayez de réunir les fichiers dans l’étape de saisie. Pour plus d’informations sur ce type d’union, consultez la section Réunir des fichiers et des tables de base de données dans l’étape de saisie(Le lien s’ouvre dans une nouvelle fenêtre).
Comme dans une jointure, vous pouvez utiliser l’opération d’union en tout point du flux.
Pour créer une union, procédez comme suit :
Après avoir ajouté au moins deux tables dans le volet Flux, sélectionnez la table concernée et faites-la glisser vers l’autre table jusqu’à ce que l’option Union s’affiche. Vous pouvez aussi cliquer sur l’icône et sélectionner Union dans le menu. Une nouvelle étape d’union est ajoutée au volet Flux et le volet Profil se met à jour pour afficher le profil de l’union.
Ajoutez des tables supplémentaires à l’union en faisant glisser des tables vers les tables de l’union jusqu’à ce que voyiez l’option Ajouter.
Dans le profil de l’union, vérifiez les métadonnées relatives à l’union. Vous pouvez supprimer les tables de l’union et consulter les détails sur les champs non concordants.
Examiner les résultats de l’union
Après avoir créé une union, examinez les résultats de l’union pour vérifier que les données de l’union sont bien celles attendues. Pour valider vos données réunies, vérifiez les domaines suivants :
Vérifier les métadonnées de l’union : Le profil d’union affiche des métadonnées sur l’union. Vous pouvez voir ici les tables qui constituent l’union, le nombre résultant de champs et les champs discordants.
Vérifier les couleurs pour chaque champ : À côté de chaque champ répertorié dans le résumé Union et au-dessus de chaque champ dans le profil de l’union, vous trouverez un ensemble de couleurs. Les couleurs correspondent à chaque table de l’union.
Si toutes les couleurs de table s’affichent pour ce champ, l’union a été correctement exécutée pour ce champ. Une couleur de table manquante indique que vous avez des champs non concordants.
Les champs discordants sont des champs qui peuvent avoir des données similaires mais qui diffèrent d’une manière ou d’une autre. Vous pouvez voir la liste des champs qui ne correspondent pas dans le résumé Union, ainsi que les tables dont ils sont issus. Pour examiner de plus près les données des champs, cochez la case Afficher uniquement les champs sans correspondance pour isoler les champs discordants dans le profil de l’union.
Pour corriger ces champs, vous pouvez appliquer l’une des suggestions de la section Corriger les champs non concordants ci-dessous.
Corriger les champs non concordants
Si les tables d’une union ne correspondent pas, l’union produit des champs supplémentaires. Ces champs sont des données valides exclues de leur contexte approprié.
Pour résoudre le problème de non-concordance de champ, vous devez fusionner les champs non concordants ensemble.
La non-concordance de champ peut se produire pour plusieurs raisons.
Des champs correspondants ont des noms différents : Si des champs correspondants entre les tables ont des noms différents, vous pouvez utiliser les recommandations d’union, fusionner manuellement les champs de la liste Champs discordants, renommer le champ dans le profil de l’union afin de fusionner ensemble les champs non concordants.
Pour utiliser les recommandations d’union, procédez comme suit :
Dans la liste Champs discordants, cliquez sur un champ discordant. S’il existe une suggestion de correspondance, le champ correspondant est mis en évidence en jaune.
Les suggestions de correspondance sont basées sur les champs présentant des types de données et des noms de champ similaires.
Survolez le champ mis en évidence et cliquez sur le bouton Plus pour fusionner les champs.
Pour fusionner manuellement des champs de la liste Champs discordants, procédez comme suit :
Sélectionnez un ou plusieurs champs dans la liste.
Faites un clic droit ou Ctrl-clic (MacOS) sur un champ sélectionné et si la fusion est valide, l’option de menu Fusionner les champs apparaît.
Si vous voyez s’afficher Aucune option disponible lorsque vous faites un clic droit sur le champ, il est possible que les champs ne puissent pas être fusionnés. (par exemple, si vous essayez de fusionner deux champs issus de la même entrée).
Cliquez sur Fusionner les champs pour fusionner les champs sélectionnés.
Pour renommer le champ dans le volet du profil de l’union, faites un clic droit sur le nom du champ et cliquez sur Renommer le champ.
Les champs correspondants ont le même nom mais sont d’un type différent : par défaut, lorsque le nom des champs correspondants correspond, mais pas le type de données des champs, Tableau Prep modifie le type de l’un des champs afin qu’ils soient compatibles les uns avec les autres. Si Tableau Prep effectue ce changement, il est indiqué en haut du champ fusionné par l’icône Modifier le type de données.
Dans certains cas, Tableau Prep peut ne pas choisir le type de données correct. Dans ce cas, et si vous souhaitez annuler la fusion, faites un clic droit ou Ctrl+clic (MacOS) sur l’icône Modifier le type de données et sélectionnez Séparer les entrées avec différents types.
Vous pouvez ensuite fusionner les champs tout d’abord en modifiant le type de données de l’un des champs, puis en utilisant les suggestions de la section Options supplémentaires de fusion des champs.Les tables correspondantes ont un nombre de champs différent : pour réunir des tables, il faut que chaque table de l’union contienne le même nombre de champs. Si une union génère des champs supplémentaires, fusionnez le champ en un champ existant.
Options supplémentaires de fusion des champs
Outre les méthodes de fusion des champs décrites dans la section ci-dessus, vous pouvez également utiliser l’une des méthodes suivantes pour fusionner des champs. Vous pouvez fusionner les champs à toute étape, sauf pour l’étape Sortie.
Pour des renseignements sur la fusion de champs dans le même fichier, consultez Fusionner des champs.
Pour fusionner des champs, procédez comme suit :
Faites glisser et déposez un champ sur un autre. Un indicateur Déposer pour fusionner les champs s’affiche.
Sélectionnez plusieurs champs et faites un clic droit dans la sélection pour ouvrir le menu contextuel, puis cliquez sur Fusionner les champs.
Sélectionnez plusieurs champs, puis cliquez sur Fusionner les champs dans la barre d’outils contextuelle.