Optimiser les requêtes relationnelles à l’aide d’options de performance
Les options de performances sont des paramètres optionnels qui définissent la cardinalité (caractère unique) et l’intégrité référentielle (enregistrements correspondants) entre deux tables dans une relation. Ces paramètres aident Tableau à optimiser les requêtes lors de l’analyse.
- Si vous ne savez pas quoi choisir, utilisez les paramètres par défaut recommandés indiqués par Tableau. L’utilisation des valeurs par défaut est sûre et générera automatiquement des agrégations et des jointures correctes lors de l’analyse. Si vous ne connaissez pas la cardinalité ou l’intégrité référentielle, vous n’avez pas besoin de modifier ces paramètres.
- Si vous connaissez la forme de vos données, vous pouvez éventuellement modifier ces paramètres pour représenter le caractère unique et la correspondance entre les enregistrements des deux tables.
Dans de nombreux scénarios d’analyse, l’utilisation des paramètres par défaut d’une relation vous fournit toutes les données dont vous avez besoin pour l’analyse. Dans certains cas, vous pouvez souhaiter ajuster les paramètres des options de performances pour décrire vos données avec plus de précision. Pour plus de détails sur l’utilisation des relations pour combiner et analyser les données, consultez Relier vos données(Le lien s’ouvre dans une nouvelle fenêtre) ainsi que ce billet de blog Tableau : Relations, 1ère partie : Présentation des nouvelles fonctionnalités de modélisation des données dans Tableau(Le lien s’ouvre dans une nouvelle fenêtre).
Ce que signifient les paramètres de cardinalité et d’intégrité référentielle
Options de cardinalité
Les paramètres de cardinalité déterminent si le tableau agrège les données de la table avant ou après avoir automatiquement lié les données pendant l’analyse.
- Sélectionnez Plusieurs si les valeurs des champs ne sont pas uniques, ou si vous ne savez pas. Tableau regroupera les données pertinentes avant de former des jointures au cours de l’analyse.
- Sélectionnez Un si les valeurs des champs sont uniques. Au cours de l’analyse, les données pertinentes seront liées avant l’agrégation. La configuration correcte de cette option optimise les requêtes dans le classeur lorsque les valeurs des champs dans la relation sont uniques. Par contre, si vous sélectionnez Un alors que les valeurs des champs ne sont pas uniques, il peut arriver que les valeurs agrégées s’affichent en double dans la vue.
Remarque : si vous sélectionnez l’option Un, tous les enregistrements sont traités comme si chaque valeur de clé était unique et qu’il n’y avait qu’une seule ligne avec une valeur null.
Options d’intégrité référentielle
Les paramètres d’intégrité référentielle déterminent les types de jointures que Tableau utilise pour obtenir les valeurs de dimensions d’une mesure lors de l’analyse.
- Sélectionnez Certains enregistrements correspondent si certaines valeurs dans le champ ne correspondent pas dans l’autre table, ou si vous ne savez pas. Au cours de l’analyse, Tableau utilise des jointures externes pour obtenir les valeurs de dimensions d’une mesure. Toutes les valeurs de mesures seront affichées dans la vue, même les mesures sans correspondance.
- Sélectionnez Tous les enregistrements correspondent si les valeurs du champ sont garanties d’avoir une correspondance dans l’autre table. Ce paramètre permet de générer des jointures moins nombreuses et plus simples lors de l’analyse, et d’optimiser les requêtes. Il se peut que vous obteniez des résultats incohérents pendant l’analyse (valeurs sans correspondance supprimées ou manquantes à l’écran) s’il y a des valeurs sans correspondance dans cette table.
Remarques : si vous sélectionnez Tous les enregistrements correspondent, les enregistrements sont traités comme s’il n’existait pas de valeurs null dans les champs utilisés pour la relation. Au cours de l’analyse, Tableau utilise les jointures internes pour obtenir les valeurs de dimensions d’une mesure. Par défaut, Tableau ne liera jamais des clés nulles.
Pour plus d’informations sur les concepts de cardinalité et d’intégrité référentielle, consultez Cardinalité et Intégrité référentielle.
Qu’est-il advenu des jointures ?
Vous pouvez toujours spécifier des jointures entre les tables dans la couche physique d’une source de données. Double-cliquez sur une table logique pour accéder à l’espace de travail des jointures.
Chaque table logique de haut niveau contient au moins une table physique. Ouvrez une table logique pour afficher, modifier ou créer des jointures entre ses tables physiques. Faites un clic droit sur une table logique, puis cliquez sur Ouvrir. Il suffit sinon de double-cliquer sur la table pour l’ouvrir.
Lorsque vous créez une source de données, elle comporte deux couches. La couche de niveau supérieur est la couche logique de la source de données. Vous combinez les données entre les tables dans la couche logique en utilisant des relations.
La couche suivante est la couche physique de la source de données. Vous combinez les données entre les tables de la couche physique à l’aide de jointures. Pour plus d’informations, consultez Tables logiques et tables physiques dans le modèle de données(Le lien s’ouvre dans une nouvelle fenêtre).
Conseils sur l’utilisation des options de performance
Si vous connaissez la forme de vos données, vous pouvez utiliser les paramètres optionnels dans les options de performance pour établir la cardinalité des tables les unes par rapport aux autres (un-à-un, un-à-plusieurs, plusieurs-à-plusieurs) et indiquer l’intégrité référentielle (les valeurs d’une table auront toujours une correspondance dans l’autre table).
Au lieu de considérer les paramètres des Options de performance en termes de « Oui » ou « Non », envisagez-les en termes de « Oui » et « Je ne sais pas ». Si vous êtes sûr que les valeurs d’une table sont uniques, sélectionnez Un. Si vous êtes sûr que chaque enregistrement dans une table correspond à un ou plusieurs enregistrements dans l’autre table, sélectionnez Tous les enregistrements correspondent. Sinon, laissez les paramètres par défaut tels qu’ils sont.
Si vous n’êtes pas sûr de la forme de vos données, utilisez les paramètres par défaut. Lorsque Tableau ne peut pas détecter ces paramètres dans vos données, les paramètres Par défaut sont :
- Cardinalité : plusieurs-à-plusieurs
- Intégrité référentielle : certains enregistrements correspondent
Si Tableau détecte des relations clés ou l’intégrité référentielle dans vos données, ces paramètres seront utilisés et indiqués comme « détectés ».
Pour réappliquer les paramètres par défaut, cliquez sur Rétablir les valeurs par défaut.
Définition des termes
La cardinalité fait référence au caractère unique des données contenues dans un champ (colonne) ou une combinaison de champs. Lorsque les tables que vous souhaitez analyser contiennent de nombreuses lignes de données, les requêtes peuvent être lentes (et les performances de la source de données générale sont affectées). Tableau recommande alors de choisir une méthode de combinaison des données basée sur la cardinalité des colonnes reliées entre les tables.
- Faible cardinalité : c’est le cas lorsque les colonnes reliées contiennent beaucoup de données répétées. Par exemple, une table appelée Produits peut comporter une colonne Catégorie qui contient trois valeurs : Meubles, Fournitures de bureau et Technologie.
- Cardinalité élevée : c’est le cas lorsque les colonnes reliées ont des données à caractère unique. Par exemple, une table appelée Commandes peut comporter une colonne ID de commande contenant une valeur unique pour chaque commande de produit.
L’intégrité référentielle signifie qu’une table aura toujours une ligne correspondante dans l’autre table. En d’autres termes, une table Ventes aura toujours une ligne correspondante dans la table Catalogue des produits.