Agréger, lier ou réunir des données

Vous pouvez agréger, lier ou réunir vos données pour regrouper ou combiner des données à des fins d'analyse.

Agréger et regrouper les données

Parfois vous devez ajuster la granularité de certaines données, soit pour réduire la quantité de données produites à partir du flux, soit pour aligner des données avec d'autres données que vous souhaitez lier ou réunir. Par exemple, vous pouvez souhaiter agréger des données de ventes par client avant de lier une table de ventes avec une table de clients.

Si vous avez besoin d'ajuster la granularité de vos données, utilisez l'option Ajouter une agrégation pour créer une étape d'agrégation ou de regroupement des données. Le fait que les données soient agrégées ou regroupées dépend du type de données (chaîne, nombre ou date).

  1. Dans le volet Flux, cliquez sur l'icône plus et sélectionnez Ajouter une agrégation. Une nouvelle étape d'agrégation s'affiche dans le volet Flux et le volet Profil est mis à jour pour afficher le profil d'agrégation et de groupe.

  2. Pour regrouper ou agréger des champs, faites-les glisser depuis le volet gauche vers l'une des colonnes dans le volet droit.

    Vous pouvez aussi :

    • Faire glisser et déposer des champs entre les deux volets.

    • Rechercher des champs dans la liste et sélectionner uniquement les champs que vous souhaitez inclure dans l'agrégation.

    • Double-cliquer sur un champ pour l'inclure dans le volet gauche ou droit.

    • Modifier la fonction du champ pour l'ajouter automatiquement au volet approprié.

    • Cliquer sur Ajouter tout ou Tout supprimer pour appliquer ou supprimer des champs en lots.

    • Appliquez certaines opérations de nettoyage aux champs. Pour plus d’informations sur les options de nettoyage disponibles, consultez À propos des opérations de nettoyage(Link opens in a new window).

    Les champs sont distribués entre les colonnes Champs regroupés et Champs agrégés en fonction de leur type de données. Cliquez sur les en-têtes de type de groupe ou d'agrégation (par exemple, AVG ou SUM) pour modifier le type de groupe ou d'agrégation.

    Dans les grilles de données sous le profil d'agrégation et de groupe, vous pouvez voir un échantillon des membres du groupe ou de l'agrégation.

    Toutes les opérations de nettoyage exécutées sur les champs sont enregistrées dans le volet Modifications.

Lier vos données

Les données que vous analysez dans Tableau sont composées d'un ensemble de tables liées par des champs spécifiques. La jointure est une méthode permettant de combiner les données associées dans ces champs communs. Le résultat de la combinaison de données à l'aide d'une jointure est une table qui s'étend généralement à l'horizontale suite à l'ajout de champs de données.

La jointure est une opération que vous pouvez effectuer en tout point du flux. La jointure à un stade précoce du flux peut vous aider à comprendre vos ensembles de données et faire apparaître les points qui nécessitent votre attention immédiate.

Tableau Prep Builder prend en charge les types de jointure suivants :

Type de jointure Description
Gauche Pour chaque ligne, inclue toutes les valeurs de la table gauche et toutes les valeurs correspondantes de la table droite. Lorsqu'une valeur de la table gauche n'a pas de correspondance dans la table droite, vous voyez une valeur null dans les résultats de la jointure.
Interne Pour chaque ligne, inclut les valeurs qui ont des correspondances dans les deux tables.
Droite Pour chaque ligne, inclut toutes les valeurs de la table droite et les valeurs correspondantes de la table gauche. Lorsqu'une valeur de la table gauche n'a pas de valeur correspondante dans la table droite, vous voyez une valeur null dans les résultats de la jointure.
leftOnly Pour chaque ligne, inclut uniquement les valeurs de la table gauche qui ne correspondent à aucune valeur de la table droite. Les valeurs de champ de la table droite s’affichent sous forme de valeurs null dans les résultats de la jointure.
rightOnly Pour chaque ligne, inclut uniquement les valeurs de la table droite qui ne correspondent à aucune valeur de la table gauche. Les valeurs de champ de la table gauche s’affichent sous forme de valeurs null dans les résultats de la jointure.
notInner Pour chaque ligne, inclut toutes les valeurs de la table droite et de la table gauche qui ne correspondent pas.
Complète Pour chaque ligne, inclut toutes les valeurs des deux tables. Lorsqu'une valeur de l'une des tables n'a pas de correspondance dans l'autre table, vous voyez une valeur null dans les résultats de la jointure.

Pour créer une jointure, procédez comme suit :

  1. Liez deux tables à l'aide de l'une des méthodes suivantes :

    • Ajoutez au moins deux tables au volet Flux, puis sélectionnez et faites glisser la table associée vers l'autre table jusqu'à ce que l'option Lier s'affiche ou cliquez sur l'icône et sélectionnez Ajouter une jointure dans le menu.

    • Cliquez sur l'icône et sélectionnez Ajouter une jointure dans le menu, puis ajoutez manuellement l'autre entrée à la jointure, et ajoutez les clauses de jointure.
    • Remarque : dans Tableau Prep Builder version 2019.1.3 et ultérieur, si vous vous connectez à une table pour laquelle des relations de tables sont définies et qui inclut des champs connexes, vous pouvez sélectionner Ajouter une jointure et faire votre choix dans la liste des tables connexes. Tableau Prep Builder crée la jointure en fonction des champs qui constituent la relation entre les deux tables.

      Pour plus d'informations sur les connecteurs avec des relations de table, voir Lier des données à l'étape des données entrantes (version 2019.1.3 et ultérieur)(Link opens in a new window).

    Une nouvelle étape de jointure est ajoutée au flux et le volet Profil se met à jour de manière à afficher le profil de jointure.

  2. Pour consulter et configurer la jointure, procédez comme suit :

    1. Consultez Résumé des résultats de la jointure pour voir le nombre de champs inclus et exclus du fait du type de jointure et des conditions de jointure.

    2. Dans Type de jointure, cliquez sur le graphique Venn pour spécifier le type de jointure souhaité.

    3. Dans Clauses de jointure appliquées, cliquez sur l'icône plus ou, dans le champ choisi pour la condition de jointure par défaut, spécifiez ou modifiez la clause de jointure. Les champs que vous avez sélectionnés dans la condition de jointure sont les champs communs aux tables de la jointure.

    4. Vous pouvez sinon cliquer sur les clauses de jointure recommandées affichées sous Recommandations relatives aux clauses de jointure pour ajouter la clause à la liste des clauses de jointure appliquées.

Examiner les résultats de la jointure

Le résumé affiché dans le profil de jointure présente les métadonnées sur la jointure pour que vous puissiez vérifier que la jointure inclut bien les données attendues.

  • Clauses de jointure appliquées : par défaut, Tableau Prep Builder définit la première clause de jointure sur la base des noms de champs communs dans les tables à lier. Ajoutez ou supprimez les clauses de jointure selon vos besoins.

  • Type de jointure : par défaut, lorsque vous créez une jointure, Tableau Prep Builder utilise une jointure interne entre les tables. Selon les données auxquelles vous vous connectez, vous pourrez peut-être utiliser les jointures gauches, internes, droites, leftOnly, rightOnly, notInner ou complètes.

  • Résumé des résultats de la jointure : le résumé des résultats de la jointure présente la répartition des valeurs incluses et exclues dans les tables de la jointure.

    • Cliquez sur chaque barre Inclus pour isoler et voir les données du profil de jointure incluses dans la jointure.

    • Cliquez sur chaque barre Exclu pour isoler et voir les données du profil de jointure exclues de la jointure.

    • Cliquez sur toute combinaison de barres Inclus et Exclu pour voir une perspective cumulée des données.

  • Recommandations relatives aux clauses de jointure : cliquez sur l'icône plus à côté de la clause de jointure recommandée pour l'ajouter à la liste Clauses de jointure appliquées.

  • Volet Clauses de jointure  : dans les Clauses de jointure, vous pouvez voir les valeurs de chaque champ dans la clause de jointure. Les valeurs qui ne répondent pas aux critères de la jointure s'affichent en texte rouge.

  • Volet Résultats de la jointure : si, dans le volet Résultats de la jointure, vous voyez des valeurs que vous souhaitez modifier, vous pouvez modifier les valeurs dans ce volet.

Problèmes courants de liaison

Si vous ne voyez pas les résultats attendus après avoir lié vos données, vous devrez peut-être effectuer un nettoyage supplémentaire de vos valeurs de champ. En raison des problèmes suivants, Tableau Prep Builder ne verra pas la correspondance entre les valeurs et les exclura de la liaison :

  • Capitalisation différente : Mes Ventes et mes ventes

  • Orthographe différente : Hawaii et Hawaï

  • Faute de frappe ou faute d'orthographe : Ma santé d'entreprise ou Ma santé d'entrepise

  • Changements de nom : Pierre Martin et Pierre Martin Jr.

  • Abréviations: My Company Limited et My Company Ltd

  • Séparateurs supplémentaires : Honolulu et Honolulu (Hawaii)

  • Espaces supplémentaires : par exemple, espace supplémentaire entre des caractères, espaces de tabulation ou espaces supplémentaires de début ou de fin

  • Utilisation incohérente des points : Retourné, inutile et retourné, inutile.

La bonne nouvelle est que si vos valeurs de champ ne présentent aucun de ces problèmes, vous pouvez corriger les valeurs de champ en ligne directement dans les Clauses de jointure ou travailler avec les valeurs exclues en cliquant sur Barres exclues dans Résumé des résultats de la jointure et utiliser les opérations de nettoyage dans le menu du volet Profil.

Pour plus d'informations sur les différentes options de nettoyage disponibles dans l'étape Lier, consultez À propos des opérations de nettoyage(Link opens in a new window).

Corriger les champs discordants et autres options

Vous pouvez corriger les champs discordants directement dans la clause de jointure. Double-cliquez ou faites un clic droit sur la valeur et sélectionnez Modifier la valeur dans le menu contextuel du champ que vous souhaitez corriger et entrez une nouvelle valeur. Vos modifications de données sont enregistrées et ajoutées au volet Modifications à droite dans l'étape Lier.

Vous pouvez également sélectionner plusieurs valeurs à conserver, exclure ou filtrer dans les volets Clauses de jointure, ou appliquer d'autres opérations de nettoyage dans le volet Résultats de la jointure. Selon les champs que vous modifiez et leur emplacement dans le processus de jointure, vos modifications sont appliquées soit avant, soit après la jointure pour vous fournir les résultats corrigés.

Pour plus d'informations sur le nettoyage des champs, consultez Appliquer des opérations de nettoyage(Link opens in a new window).

Réunir vos données

L'union est une méthode de combinaison des données par ajout de lignes d'une table dans une autre table. Par exemple, vous pouvez souhaitez ajouter les nouvelles transactions dans une table à la liste des transactions passées dans une autre table. Assurez-vous que les tables que vous réunissez comportent le même nombre de champs et les mêmes noms de champs, et que les champs utilisent le même type de données.

Conseil : Afin de maximiser les performances, une seule union peut avoir 10 entrées au maximum. Si vous avez besoin de réunir plus de 10 fichiers ou tables, essayez de réunir les fichiers dans l'étape des données entrantes. Pour plus d'informations sur ce type d'union, consultez Réunir des fichiers et des tables de base de données dans l'étape des données entrantes(Link opens in a new window).

Comme dans une jointure, vous pouvez utiliser l'opération d'union en tout point du flux.

Pour créer une union, procédez comme suit :

  1. Après avoir ajouté au moins deux tables dans le volet Flux, sélectionnez la table concernée et faites-la glisser vers l'autre table jusqu'à ce que l'option Union s'affiche. Vous pouvez aussi cliquer sur l'icône et sélectionner Ajouter une union dans le menu. Une nouvelle étape d'union est ajoutée au volet Flux et le volet Profil se met à jour pour afficher le profil de l'union.

  2. Ajoutez des tables supplémentaires à l'union en faisant glisser des tables vers les tables de l'union jusqu'à ce que voyiez l'option Ajouter.

  3. Dans le profil de l'union, vérifiez les métadonnées relatives à l'union. Vous pouvez supprimer les tables de l'union et consulter les détails sur les champs non concordants.

Examiner les résultats de l'union

Après avoir créé une union, examinez les résultats de l'union pour vérifier que les données de l'union sont bien celles attendues. Vous pouvez vérifier plusieurs zones du profil de l'union pour valider les données de l'union.

  • Vérifier les métadonnées de l'union : Le profil d'union affiche des métadonnées sur l'union. Vous pouvez voir ici les tables qui constituent l'union, le nombre résultant de champs et les champs discordants.

  • Vérifier les couleurs pour chaque champ : À côté de chaque champ répertorié dans le résumé Union et au-dessus de chaque champ dans le profil de l'union, vous trouverez un ensemble de couleurs. Les couleurs correspondent à chaque table de l'union.

    Si toutes les couleurs de table s'affichent pour ce champ, l'union a été correctement exécutée pour ce champ. Une couleur de table manquante indique que vous avez des champs non concordants.

    Les champs discordants sont des champs qui peuvent avoir des données similaires mais qui diffèrent d'une manière ou d'une autre. Vous pouvez voir la liste des champs qui ne correspondent pas dans le résumé Union, ainsi que les tables dont ils sont issus. Pour examiner de plus près les données des champs, cochez la case Afficher uniquement les champs sans correspondance pour isoler les champs discordants dans le profil de l'union.

    Pour corriger ces champs, vous pouvez appliquer l'une des suggestions de la section « Corriger les champs non concordants » ci-dessous.

Corriger les champs non concordants

Si les tables d'une union ne correspondent pas, l'union produit des champs supplémentaires. Ces champs sont des données valides exclues de leur contexte approprié.

Pour résoudre le problème de non-concordance de champ, vous devez fusionner les champs non concordants ensemble.

La non-concordance de champ peut se produire pour plusieurs raisons.

  • Des champs correspondants ont des noms différents : Si des champs correspondants entre les tables ont des noms différents, vous pouvez utiliser les recommandations d'union, fusionner manuellement les champs de la liste Champs discordants, renommer le champ dans le profil de l'union afin de fusionner ensemble les champs non concordants.

    Pour utiliser les recommandations d'union, procédez comme suit :

    1. Dans la liste Champs discordants, cliquez sur un champ discordant. S'il existe une suggestion de correspondance, le champ correspondant est surligné en jaune.

      Les suggestions de correspondance sont basées sur les champs présentant des types de données et des noms de champ similaires.

    2. Survolez le champ surligné et cliquez sur le bouton Plus pour fusionner les champs.

    Pour fusionner manuellement des champs de la liste Champs discordants, procédez comme suit :

    1. Sélectionnez un ou plusieurs champs dans la liste.

    2. Faites un clic droit sur un champ sélectionné et si la fusion est valide, l'option de menu Fusionner les champs apparaît.

      Si vous voyez s'afficher Aucune option disponible lorsque vous faites un clic droit sur le champ, il est possible que les champs ne puissent pas être fusionnés. (par exemple, si vous essayez de fusionner deux champs issus de la même entrée).

    3. Cliquez sur Fusionner les champs pour fusionner les champs sélectionnés.

    Pour renommer le champ dans le volet du profil de l'union, faites un clic droit sur le nom du champ et cliquez sur Renommer le champ.


  • Les champs correspondants ont le même nom mais sont d'un type différent : par défaut, lorsque le nom des champs correspondants concorde mais pas leur type de données, Tableau Prep Builder modifie le type de l'un des champs afin qu'ils soient compatibles les uns avec les autres. Si Tableau Prep Builder effectue ce changement, il est indiqué en haut du champ fusionné par l'icône Modifier le type de données.

    Change Data Type Icon

    Dans certains cas, Tableau Prep Builder peut ne pas choisir le type de données correct. Dans ce cas, et si vous souhaitez annuler la fusion, faites un clic droit sur l'icône Modifier le type de données et sélectionnez Séparer les entrées avec différents types.


    Vous pouvez ensuite fusionner les champs tout d'abord en modifiant le type de données de l'un des champs, puis en utilisant les suggestions de la section Options supplémentaires de fusion des champs.

  • Les tables correspondantes ont un nombre de champs différent : pour réunir des tables, il faut que chaque table de l'union contienne le même nombre de champs. Si une union génère des champs supplémentaires, fusionnez le champ en un champ existant.

Options supplémentaires de fusion des champs

Outre les méthodes de fusion des champs décrites dans la section ci-dessus, vous pouvez également utiliser l'une des méthodes suivantes pour fusionner des champs. Vous pouvez fusionner les champs à toute étape, sauf pour l'étape Sortie.

Pour des informations sur la fusion de champs dans le même fichier, consultez Fusionner des champs.

Pour fusionner des champs, procédez comme suit :

  • Faites glisser et déposez un champ sur un autre. Un indicateur Déposer pour fusionner les champs s'affiche.

  • Sélectionnez plusieurs champs et faites un clic droit dans la sélection pour ouvrir le menu contextuel, puis cliquez sur Fusionner les champs.

  • Sélectionnez plusieurs champs, puis cliquez sur Fusionner les champs dans la barre d'outils contextuelle.

Merci de vos commentaires ! Erreur lors de la soumission de votre commentaire. Réessayez ou envoyez-nous un message.