Ce qui a changé pour les sources de données et l’analyse
Depuis Tableau version 2020.2, plusieurs améliorations majeures contribuent à rendre l’analyse multi-tables plus facile et plus intuitive.
Les fonctionnalités de modélisation de données dans Tableau vous aident à analyser plus facilement les données sur plusieurs tables. Avec une couche logique et des relations dans les sources de données, vous pouvez créer des modèles de données multi-tables sous forme de schémas en étoile et en flocon avec plusieurs tables de faits de différents niveaux de détail (LOD).
- Les sources de données sont plus faciles à créer, à gérer et à analyser. Les sources de données ont une nouvelle couche logique où vous pouvez créer des relations flexibles entre les tables. Créez des modèles de données multi-tables et multi-faits en reliant des tables de différents niveaux de détail. Intégrez plus facilement les données de plusieurs tables et gérez moins de sources de données pour répondre à vos besoins analytiques.
- Les relations rendent l’expérience d’analyse plus intuitive. Inutile désormais de vous lancer dans une planification approfondie des jointures et de faire des hypothèses sur les types de jointure requises pour préparer vos données pour l’analyse. Tableau sélectionne automatiquement les types de jointure en fonction des champs utilisés dans la visualisation. Au cours de l’analyse, Tableau ajuste les types de jointure de manière intelligente et préserve le niveau de détail natif dans vos données. Vous pouvez voir les agrégations au niveau de détail des champs dans votre visualisation plutôt que d’avoir à penser aux jointures sous-jacentes. Les relations peuvent être du type plusieurs-à-plusieurs et gérer des jointures externes complètes. Vous n’avez pas besoin d’utiliser des expressions LOD telles que FIXED pour dédupliquer des données dans des tables reliées.
- Le volet Source de données, la fenêtre Afficher les données et le volet Données du classeur ont été mis à jour de manière à prendre en charge une expérience d’analyse multi-tables. Votre première vue de l’espace de travail du volet Source de données est la couche logique, où vous pouvez définir les relations entre les tables. Plusieurs parties de l’interface Tableau ont été modifiées afin de prendre en charge l’analyse multi-tables. Le volet Source de données (espace de travail, grille de données), la fenêtre Afficher les données et le volet Données du classeur ont été mis à jour de manière à prendre en charge une expérience d’analyse multi-tables. Pour plus d’informations, consultez Modifications apportées à différentes parties de l’interface(Le lien s’ouvre dans une nouvelle fenêtre). L’API pour accéder aux données de vue a également été mise à jour de manière à prendre en charge l’analyse multi-tables.
- Les requêtes contextuelles fournissent des données pertinentes selon les besoins. Une source de données qui utilise des relations facilite l’intégration d’un plus grand nombre de tables, de lignes de données et de plusieurs tables de faits dans une seule source de données. Plutôt que d’interroger l’intégralité de la source de données, Tableau extrait des données depuis les tables nécessaires pour la feuille de calcul, en fonction des champs en jeu dans la visualisation.
Visionner une vidéo : pour un aperçu des améliorations apportées aux sources de données et une introduction à l’utilisation des relations dans Tableau, visionnez cette vidéo de 5 minutes.
Remarque : L’interface de modification des relations présentée dans cette vidéo diffère légèrement de la version actuelle, mais possède les mêmes fonctionnalités.
En savoir plus sur le fonctionnement des requêtes relationnelles dans ces billets du blog Tableau :
- Relations, 1ère partie : Présentation des nouvelles fonctionnalités de modélisation des données dans Tableau(Le lien s’ouvre dans une nouvelle fenêtre)
- Relations, 2ème partie : Conseils et astuces(Le lien s’ouvre dans une nouvelle fenêtre)
- Relations, 3ème partie : Poser des questions sur plusieurs tables reliées(Le lien s’ouvre dans une nouvelle fenêtre)
Consultez également les podcasts vidéo consacrés aux relations sur le site Action Analytics(Le lien s’ouvre dans une nouvelle fenêtre), par exemple Pourquoi Tableau a-t-il inventé les relations ?(Le lien s’ouvre dans une nouvelle fenêtre) Cliquez sur « Video Podcast » dans Library(Le lien s’ouvre dans une nouvelle fenêtre) (Bibliothèque) pour afficher plus de titres.
Modifications apportées aux sources de données, au modèle de données et à la sémantique des requêtes
Prise en charge des sources de données multi-tables
Les sources de données de Tableau reconnaissent et préservent les données normalisées. Avec les sources de données multi-tables, Tableau peut gérer plusieurs niveaux de détail dans une seule source de données. Cette prise en charge vous permet de préparer et d’explorer plus facilement vos données sans avoir à écrire des calculs spécialisés pour contrôler les agrégations comme les moyennes et les totaux. Combinez des tables basées sur des schémas en étoile et en flocon pour relier de façon transparente plusieurs tables de faits. La nouvelle couche logique utilise des jointures contextuelles et dynamiques et vous donne un meilleur contrôle de domaine (voir Schémas de modèle de données pris en charge).
Tableau reconnaît et gère les relations sous-jacentes entre les tables, de sorte que le nombre de jointures et de calculs nécessaires s’en trouve réduit. Comme ces sources de données optimisées peuvent répondre à une plus grande variété de questions, vous pouvez consolider le nombre de sources de données distinctes que vous devez créer et gérer. Il faut moins de sources de données pour représenter les mêmes données.
Qu’est-ce qui n’a pas changé ?
Les relations dans la couche logique vous offrent davantage d’options pour combiner les données (rien n’a été enlevé). Vous pouvez toujours créer des sources de données à table unique dans Tableau. Vous pouvez créer une table logique à l’aide d’une combinaison de jointures, d’unions, de SQL personnalisé, etc. Le comportement d’analyse sur une seule table dans Tableau n’a pas changé. L’analyse sur une seule table logique contenant un mélange de dimensions et de mesures fonctionne de la même manière que dans Tableau version 2020.1 et versions antérieures.
Voir aussi Questions sur les relations, le modèle de données et les sources de données.
Nouvelle couche logique dans la source de données
Dans les versions précédentes de Tableau, le modèle de données dans votre source de données était constitué d’une seule couche physique où vous pouviez spécifier des jointures(Le lien s’ouvre dans une nouvelle fenêtre) et des unions. Les tables ajoutées à la couche physique (par jointure ou union) créent une seule table aplatie (dénormalisée) pour l’analyse.
Versions précédentes | 2020.2 et ultérieur | |
---|---|---|
Depuis Tableau version 2020.2, le modèle de données dans votre source de données comprend une nouvelle couche sémantique au-dessus de la couche physique (appelée la couche logique), où vous pouvez ajouter plusieurs tables et les relier les unes aux autres en fonction des paires de champs assorties. Les tables au niveau de la couche logique ne sont pas fusionnées dans la source de données, elles restent distinctes (normalisées) et conservent leur niveau de détail natif.
Les tables logiques agissent comme des conteneurs pour les tables physiques. Vous pouvez toujours utiliser les jointures et les unions entre les tables physiques. Il suffit de cliquer deux fois sur une table logique pour l’ouvrir et travailler avec les jointures ou les unions.
La couche logique vous permet de combiner plus facilement vos données pour une variété de scénarios analytiques. Vous pouvez utiliser et créer des modèles de données normalisés sous forme de schémas en étoile et en flocon, et des modèles flexibles avec des tables de faits à différents niveaux de granularité.
Pour plus d’informations, consultez Modèle de données Tableau et Schémas de modèle de données pris en charge.
Sémantique de requêtes basée sur des relations
Les relations sont une manière dynamique et flexible de combiner les données issues de plusieurs tables pour l’analyse. Elles peuvent être du type plusieurs-à-plusieurs et gérer des jointures externes complètes. Vous n’avez pas besoin d’utiliser des expressions LOD telles que FIXED pour dédupliquer des données dans des tables reliées.
Considérez une relation comme un contrat entre deux tables. Lorsque vous créez une visualisation avec des champs issus de ces tables, Tableau intègre les données depuis ces tables en utilisant ce contrat pour créer une requête avec les jointures appropriées.
Nous vous recommandons d’utiliser les relations comme première approche pour combiner vos données, car elles rendent la préparation et l’analyse des données plus faciles et plus intuitives. Utilisez des jointures seulement lorsque vous en avez absolument besoin(Le lien s’ouvre dans une nouvelle fenêtre).
- Pas de type de jointure à l’avance. Il vous suffit de sélectionner les champs correspondants pour définir une relation (pas de types de jointure). Étant donné que vous ne spécifiez pas le type de jointure, vous ne voyez pas un diagramme de Venn lorsque vous configurez des relations.
- Automatiques et contextuelles. Les relations défèrent les jointures au moment et au contexte de l’analyse. Tableau sélectionne automatiquement les types de jointure en fonction des champs utilisés dans la visualisation. Au cours de l’analyse, Tableau ajuste les types de jointure de manière intelligente et préserve le niveau de détail natif dans vos données. Vous pouvez voir les agrégations au niveau de détail des champs dans votre visualisation plutôt que d’avoir à penser aux jointures sous-jacentes.
- Flexibles. La combinaison de tables à l’aide de relations est similaire à la création d’une source de données personnalisée et flexible pour chaque visualisation, le tout dans une seule source de données pour le classeur. Étant donné que Tableau interroge uniquement les tables qui sont nécessaires en fonction des champs et des filtres dans une visualisation, vous pouvez créer une source de données pouvant être utilisée pour divers flux analytiques.
Pour plus d’informations, voir Relier vos données(Le lien s’ouvre dans une nouvelle fenêtre), Utiliser les relations sans crainte(Le lien s’ouvre dans une nouvelle fenêtre) et Relations, 1ère partie : Présentation des nouvelles fonctionnalités de modélisation des données dans Tableau(Le lien s’ouvre dans une nouvelle fenêtre).
Remarque : pour accéder à l’espace de travail de la jointure d’origine, double-cliquez sur une table logique dans la vue de niveau supérieur (la couche logique de la source de données). Vous pouvez toujours ajouter des jointures et des unions entre les tables dans la couche physique de la source de données. Pour plus de détails, consultez Modèle de données Tableau.
Sources de données migrées
Lorsque vous ouvrez un classeur ou une source de données pré-2020.2 dans une version 2020.2 ou ultérieure de Tableau, votre source de données apparaît sous la forme de table logique unique dans l’espace de travail. Vous pouvez continuer à utiliser le classeur comme vous le faisiez auparavant.
Si votre source de données contenait plusieurs tables liées ou réunies, la table logique unique s’affichait avec le nom « Données migrées ». Vous pouvez renommer la table Données migrées.
Pour voir les tables physiques qui constituent la table logique unique, double-cliquez sur cette table logique pour l’ouvrir dans la couche physique. Vous verrez ses tables physiques sous-jacentes, y compris les jointures et les unions.
Création Web
Votre classeur doit utiliser une source de données intégrée pour que vous soyez en mesure de modifier les relations et les options de performance sur le volet Source de données dans la création Web (Tableau Server ou Tableau Cloud).
Extraits
Les données d’extrait peuvent être stockées sur des tables logiques (remplace l’option Table unique) ou des tables physiques (remplace l’option Tables multiples). Pour plus d’informations, consultez Extraire vos données.
Modifications apportées aux différentes parties de l’interface
Modifications du volet Source de données
L’espace de travail du volet Source de données comporte deux couches : une couche logique et une couche physique. La vue par défaut que vous voyez dans le volet Source de données est nouvelle. Elle affiche la couche logique, laquelle utilise des relations (« fils ») entre les tables.
Vous pouvez toujours ajouter des jointures et des unions entre les tables dans la couche physique. Il suffit de double-cliquer sur une table logique dans la vue logique de haut niveau pour passer à la couche physique. Pour plus de détails, consultez Modèle de données Tableau.
Grille de données
Lorsque la source de données est constituée de plusieurs tables liées, sélectionnez une table logique pour en afficher les données dans la grille de données qui s’affiche sous le modèle de données. Avec les relations, les données n’ont pas été fusionnées, si bien que vous verrez les valeurs pour la table logique actuellement sélectionnée. Si vous avez besoin de permuter des colonnes, vous devez ouvrir une table logique et permuter les données dans la vue de table physique dans la source de données.
Volet Données dans les feuilles de calcul
Le volet Données a été mis à jour de manière à prendre en charge les relations et l’analyse multi-tables.
Vous ne verrez plus les étiquettes Dimensions et Mesures dans le volet Données. Les champs de dimensions et de mesures peuvent être organisés par table (Regrouper par table de source de données) ou dossier (Regrouper par dossier). Les dimensions sont affichées au-dessus de la ligne grise, et les mesures sous la ligne grise pour chaque table ou dossier. Dans certains cas, une table peut afficher uniquement les dimensions, ou uniquement les mesures pour commencer.
Vous ne verrez plus le champ Nombre d’enregistrements dans les sources de données qui contiennent des tables logiques. Chaque table inclut le nombre total de ses enregistrements, sous la forme d’un champ nommé TableName(Count), au niveau de détail défini pour cette table. Dans l’exemple précédent, vous pouvez voir Addresses(Count), Customers(Count), et LineItems(Count).
COUNT de table = SUM de Nombre d’enregistrements par table. Vous ne pouvez pas créer des calculs en plus du champ Count d’une table. Count fonctionne en mode agrégation uniquement.
Remarque : vous pouvez voir le champ Nombre d’enregistrements dans le volet Données si vous ouvrez un classeur pré-2020.2 qui utilisait Nombre d’enregistrements dans une vue.
Les champs calculés sont répertoriés avec leur champ d’origine, si tous leurs champs d’entrée proviennent de la même table.
Les ensembles et les groupes s’affichent sous la table avec leur champ d’origine.
Les champs qui n’appartiennent pas à une table spécifique ou ne sont pas regroupés sous un dossier sont affichés dans la zone générale sous les tables. Ces types de champs incluent notamment les calculs agrégés, les calculs qui utilisent des champs issus de plusieurs tables, le nombre d’enregistrements le cas échéant, les noms de mesures et les valeurs de mesures.
Dans la version 2024.2 et versions ultérieures : les noms de champs sont affichés en texte gris clair dans le volet Données lorsqu’ils ne sont liés à aucun champ utilisé dans la vue. Vous pouvez toujours utiliser ces champs pour l’analyse dans la visualisation, mais les champs non liés sont évalués différemment des champs liés dans l’analyse. Vous pourriez constater ce comportement si vous utilisez une source de données avec des relations multi-faits(Le lien s’ouvre dans une nouvelle fenêtre).
Afficher les données
Dans la fenêtre Afficher les données, lorsque la source de données contient plusieurs tables logiques, le nombre de lignes et de données est répertorié au niveau de détail natif pour chaque table dans des onglets séparés.
Pour plus d’informations, consultez Afficher les données sous-jacentes.
Les champs calculés sont répertoriés avec leur champ d’origine.
Les calculs LOD n’apparaissent pas nécessairement dans Afficher les données pour une table logique, car un calcul LOD peut présenter une granularité différente de celle de la table elle-même. Si la dimensionnalité d’un calcul LOD comprend des champs à partir d’une seule table, ce calcul LOD apparaîtra dans sa propre table dans le volet Données.
Modifications apportées à l’ordre des colonnes Afficher les données dans Tableau 2020.2 et versions ultérieures
Lorsque vous ouvrez une source de données dans Tableau version 2020.1 et versions antérieures et Tableau 2020.2 et versions ultérieures, il se peut que l’ordre des colonnes soit différent. Les colonnes peuvent être affichées différemment dans la fenêtre Afficher les données, et l’ordre des colonnes peut être différent lorsque vous les exportez au format CSV.
Ce changement apporté au mode de gestion de l’ordre des colonnes dans la fenêtre des données de la vue est nécessaire pour prendre en charge les relations et les tables logiques.
Si vous utilisez des scripts qui dépendent d’un ordre de colonnes personnalisé, nous vous recommandons d’utiliser l’API Extensions Tableau pour les données de la vue quand vous téléchargez des données sous-jacentes au format CSV.
Modifications apportées à l’analyse avec des sources de données multi-tables
L’utilisation d’une source de données qui comporte plusieurs tables reliées a une incidence sur le mode d’analyse dans Tableau. Étant donné que plusieurs tables reliées ont des domaines indépendants et conservent leur niveau de détail natif, lorsque vous faites glisser des champs dans la vue :
- Les données sont interrogées à leur niveau de détail naturel.
- Seules les données pertinentes pour une visualisation sont interrogées.
- Les relations entre les tables affectent les résultats de la requête. Le flux de création d’une visualisation peut varier selon la manière dont les tables de champs sont reliées les unes aux autres dans le modèle de données, ou si elles ne sont pas reliées directement.
Avantages de l’utilisation de sources de données muti-tables avec des relations :
- Les relations utilisent des jointures, mais elles sont automatiques. Tableau sélectionne automatiquement les types de jointure en fonction des champs utilisés dans la visualisation. Au cours de l’analyse, Tableau ajuste les types de jointure de manière intelligente et préserve le niveau de détail natif dans vos données.
- Tableau utilise les relations pour générer des agrégations correctes et des jointures appropriées lors de l’analyse, en fonction du contexte actuel des champs utilisés dans une feuille de calcul.
- Plusieurs tables à différents niveaux de détail sont prises en charge dans une seule source de données, si bien qu’il faut moins de sources de données pour représenter les mêmes données.
- Les valeurs de mesures sans correspondances ne sont pas abandonnées (pas de perte accidentelle de données).
- Les tables liées permettent de réduire ou d’éliminer les problèmes de duplication et de filtrage des données qui peuvent parfois résulter des jointures.
Pour plus d’informations, consultez Relier vos données, Fonctionnement de l’analyse pour les sources de données multi-tables utilisant des relations et Résoudre les problèmes de l’analyse multi-tables.
Pour des informations connexes sur le fonctionnement des requêtes relationnelles, consultez ces billets du blog Tableau :
- Relations, 1ère partie : Présentation des nouvelles fonctionnalités de modélisation des données dans Tableau(Le lien s’ouvre dans une nouvelle fenêtre)
- Relations, 2ème partie : Conseils et astuces(Le lien s’ouvre dans une nouvelle fenêtre)
À partir de Tableau version 2024.2, le modèle de données Tableau prend en charge l’analyse multi-faits et les dimensions partagées via des relations multi-faits. Pour plus d’informations, consultez À propos des modèles de données avec relations multi-faits(Le lien s’ouvre dans une nouvelle fenêtre), Dans quels cas utiliser un modèle avec relations multi-faits(Le lien s’ouvre dans une nouvelle fenêtre) et Créer un modèle de données avec relations multi-faits(Le lien s’ouvre dans une nouvelle fenêtre).
Qu’est-ce qui n’a pas changé ?
Le comportement d’analyse sur une seule table dans Tableau n’a pas changé. L’analyse d’une seule table logique contenant un mélange de dimensions et de mesures fonctionne comme dans Tableau pré-2020.2.
Visualisations ne contenant que des dimensions
Lorsque vous utilisez une source de données multi-tables avec des tables reliées : si vous créez une visualisation ne comportant que des dimensions, Tableau utilise des jointures internes et vous ne verrez pas le domaine complet sans correspondances.
Pour voir des combinaisons partielles de valeurs de dimensions, vous pouvez :
- Utiliser Afficher les lignes/colonnes vides pour voir toutes les lignes possibles. Cliquer sur le menu Analyse, puis sélectionner Disposition de table > Afficher des lignes vides ou Afficher des colonnes vides. Sachez que ce paramètre déclenchera également une densification, peut-être non souhaitable, pour les champs Date et Classe numérique.
- Ajoutez une mesure à la vue, par exemple <YourTable>(Count) à partir d’une des tables représentées dans votre visualisation. Avec cette étape, vous avez l’assurance que vous verrez toutes les valeurs de dimensions de cette table.
Comportement éventuellement surprenant des valeurs sans correspondances pour les dimensions
Lorsque vous créez une visualisation qui utilise des dimensions issues de plusieurs tables logiques, le comportement peut être surprenant au départ. Par défaut, si les dimensions d’une visualisation ou les entrées dans un calcul de niveau de ligne utilisent des champs issus de plusieurs tables logiques, Tableau n’affichera les résultats que lorsque toutes les dimensions auront des valeurs correspondantes.
Par exemple, considérons un ensemble de données contenant deux tables logiques, Clients et Achats. Certains clients n’ont effectué aucun achat et n’ont aucune ligne correspondante dans le tableau Achats. Si vous intégrez la dimension [Clients].[Nom du client], vous verrez une liste de tous les clients, qu’ils aient ou non effectué un achat. Si vous ajoutez alors la dimension [Achats].[Produit] à la visualisation, Tableau procède à une actualisation de manière à afficher les clients qui ont fait des achats ainsi que les produits qu’ils ont achetés.
Vous disposez de plusieurs façons de travailler avec ce comportement par défaut :
- Utilisez Afficher les lignes/colonnes vides pour voir toutes les lignes possibles et ramener les valeurs de dimensions sans correspondances. Cliquer sur le menu Analyse, puis sélectionner Disposition de table > Afficher des lignes vides ou Afficher des colonnes vides. Sachez que ce paramètre déclenchera également une densification =, peu-être non souhaitable, pour les champs Date et Classe numérique,
- Convertissez l’une des dimensions en une mesure. Par exemple, vous pouvez passer à l’utilisation de COUNT([Achats].[Produit)) pour conserver les clients sans achat et afficher un « 0 » dans leur cas. Il se peut que ce ne soit pas une approche viable si vous voulez voir tous les produits.
- Intégrez une mesure dans la vue de la table avec des valeurs sans correspondances. Par exemple, l’ajout de COUNT([Clients]) sur l’étagère Détails réintègrerait les clients sans correspondances, tout en continuant d’afficher tous les produits.
- Au lieu de relier les deux tables au niveau logique, vous pouvez les lier à l’aide d’une jointure externe au niveau physique, comme dans les versions précédentes de Tableau. Cette approche affichera les valeurs sans correspondances, avec quelques effets secondaires. Les requêtes seront toujours émises en interrogeant les deux tables. Les valeurs NULL apparaîtront dans les visualisations et les filtres rapides même si aucun champ de la table sans correspondances n’est utilisé. Et vous devrez écrire des calculs LOD pour supprimer toute duplication indésirable introduite par la jointure.
Utilisation du champ Count d’une table à la place de Nombre d’enregistrements
Vous ne verrez plus le champ Nombre d’enregistrements dans les sources de données qui contiennent des tables logiques. Chaque table inclut le nombre total de ses enregistrements, sous la forme d’un champ nommé TableName(Count), au niveau de détail défini pour cette table. Dans l’exemple précédent, vous pouvez voir Addresses(Count), Customers(Count), et LineItems(Count).
COUNT de table = SUM de Nombre d’enregistrements par table. Vous ne pouvez pas créer des calculs en plus du champ Count d’une table. Count fonctionne en mode agrégation uniquement.
Remarque : vous pouvez voir le champ Nombre d’enregistrements dans le volet Données si vous ouvrez un classeur pré-2020.2 qui utilisait Nombre d’enregistrements dans une vue.
Calculs inter-tables
Vous pouvez écrire des calculs qui s’étendent sur plusieurs tables. Sachez que les calculs inter-tables utilisent la sémantique de requête des jointures internes par défaut. Le calcul réside au-dessus de la jointure entre les tables logiques qu’il référence. Avec les relations, il est possible d’écrire des calculs de niveau de ligne à travers différentes tables pour générer des jointures externes.
Les calculs sont évalués après l’ajout de dimensions null, de sorte que vous pouvez modifier une valeur null en un autre élément à l’aide d’un calcul tel que : IFNULL ([Dimension], "Manquant").
Totaux généraux à l’aide de SUM
Les totaux généraux utilisant SUM reflètent le total réel au niveau de détail natif de la table logique d’un champ, plutôt que la valeur SUM des sous-totaux.
Valeurs null et jointures automatiques résultant de relations
Dans Tableau version 2020.2 et versions ultérieures, lors de l’exécution des jointures résultant de relations, Tableau n’effectue pas de jointures de valeurs null par rapport à des valeurs null.
Comportement de valeurs null sans correspondances
Lorsque vous ajoutez une mesure à la vue, une valeur de dimension null est ajoutée lorsque la mesure comporte des valeurs qui ne sont pas associées à une dimension.
Ce comportement se produit parce que Tableau traite les valeurs sans correspondances (ou les valeurs de dimensions non associées) de la même manière que les valeurs NULL vraies dans la source de données sous-jacentes. Dans les deux cas, les valeurs seront agrégées ou filtrées ensemble.
Par exemple, avec SUM(Sales),[State]
, chaque État apparié représente un État. Sa valeur SUM(Sales) est la somme pour un seul État. Pour les valeurs null sans correspondances, la valeur SUM(Sales) peut refléter de nombreux États.
Si vous ne souhaitez pas ce comportement, vous pouvez nettoyer vos données afin que chaque ligne dans la table de mesures corresponde à une ligne dans la table de dimensions. Vous pouvez utiliser Tableau Prep pour cette opération. Ou bien, dans une feuille, vous pouvez filtrer la valeur NULL en cliquant sur la valeur NULL et en sélectionnant Exclure. Après cela, vous pouvez modifier la relation entre la table de mesures et la table de dimensions en sélectionnant Tous les enregistrements correspondent dans les paramètres Options de performance.
Traiter les valeurs null sans correspondances dans la boîte de dialogue Modifier le filtre
Lorsque vous appliquez un filtre à une dimension, les règles s’appliquant lors de l’apparition de valeur null sont les suivantes :
- Dans l’onglet Général, vous pouvez explicitement inclure ou exclure la ligne null l’aide de la case à cocher.
- Dans l’onglet Caractère générique, le paramètre n’aura pas d’impact sur l’affichage ou non de valeur null (puisqu’il ne filtre que les valeurs de texte et qu’une valeur null n’est pas traitée comme une valeur de texte).
- Dans les onglets Condition ou Premiers, l’utilisation d’un paramètre autre que Aucun entraînera le filtrage de l’état « Null ».
Validation des relations
Vous disposez de plusieurs options pour valider votre modèle de données à des fins d’analyse. Au fur et à mesure que vous créez le modèle pour votre source de données, nous vous recommandons d’accéder à une feuille, de sélectionner cette source de données, puis de créer une visualisation qui explore le nombre d’enregistrements, les données attendues, les valeurs sans correspondances, les valeurs null ou les valeurs de mesures répétées. Essayez de travailler avec des champs de différentes tables pour vous assurer que tout se présente comme attendu.
Que rechercher :
- Vos relations dans le modèle de données utilisent-elles les champs correspondants corrects pour leurs tables ?
- L’ajout de plusieurs paires de champs correspondants rendrait-il la relation plus précise ?
- Que se passe-t-il si vous faites glisser différentes dimensions et mesures dans la vue depuis différentes tables ?
- Voyez-vous le nombre de lignes attendu ?
- Si vous avez modifié l’un des paramètres d’options de performance par rapport aux paramètres par défaut, les valeurs que vous voyez dans la visualisation correspondent-elles à vos attentes ? Si ce n’est pas le cas, vous pouvez vérifier les paramètres, ou les réinitialiser à la valeur par défaut.
Options de validation des relations et du modèle de données :
- Chaque table inclut le nombre total de ses enregistrements, sous la forme d’un champ nommé TableName(Count), au niveau de détail défini pour cette table. Pour voir le total pour une table, faites glisser son champ Count (Total) dans la vue. Pour voir le total pour toutes les tables, sélectionnez le champ Total pour chaque table dans le volet Données, puis cliquez sur le tableau de texte dans Montre-moi.
- Cliquez sur Afficher les données dans le volet Données pour voir le nombre de lignes et de données par table. En outre, avant que vous ne commenciez à créer des relations, la visualisation des données à partir de la source de données avant ou pendant l’analyse peut être utile pour vous donner une idée de la portée de chaque table. Pour plus d’informations, consultez Afficher les données sous-jacentes.
- Faites glisser les dimensions sur les lignes pour voir le nombre de lignes dans la barre d’état. Pour voir les valeurs sans correspondances, cliquez sur le menu Analyse, puis sélectionnez Disposition de table > Afficher des lignes vides ou Afficher des colonnes vides. Vous pouvez également faire glisser différentes mesures sur la vue, par exemple<YourTable>(Count) à partir d’une des tables représentées dans votre visualisation. Vous avez ainsi l’assurance que vous verrez toutes les valeurs de dimensions de cette table.
Conseil : pour voir les requêtes générées pour les relations, vous pouvez utiliser l’enregistrement des performances dans Tableau Desktop.
- Cliquez sur le menu d’aide, puis sélectionnez Paramètres et Performances > Démarrer l’enregistrement des performances.
- Faites glisser les champs dans la vue pour créer votre visualisation.
- Cliquez sur le menu d’aide, puis sélectionnez Paramètres et Performances > Arrêter l’enregistrement des performances. Le classeur Enregistrement des performances s’ouvrira automatiquement.
- Dans le tableau de bord Résumé des performances, sous les événements triés par heure, cliquez sur une barre « Exécution de la requête », et consultez la requête ci-dessous.
Une autre option plus avancée consiste à utiliser Tableau Log Viewer(Le lien s’ouvre dans une nouvelle fenêtre) sur GitHub. Vous pouvez filtrer sur un mot-clé spécifique à l’aide de la commande end-protocol.query
. Pour plus d’informations, commencez par la page wiki Tableau Log Viewer(Le lien s’ouvre dans une nouvelle fenêtre) dans GitHub.