Filtrer vos données avec précaution

Les filtres sont une manière efficace de restreindre la quantité de données à analyser. Moins il y a de données à analyser, plus la requête s'exécute rapidement. Vous pouvez filtrer vos données de plusieurs manières dans TableauVous pouvez créer un filtre sur une source de données, vous pouvez implémenter un filtre lorsque vous créez un extrait, vous pouvez filtrer les dimensions, mesures et dates. Vous pouvez créer un filtre contextuel qui agit comme un filtre indépendant, puis tous les autres filtres que vous définissez sont des filtres dépendants car ils traitent uniquement les données qui passent à travers le filtre contextuel. Vous pouvez également afficher un filtre dans une vue avec lequel les utilisateurs interagissent. Pour plus d'informations sur le moment d'exécution des filtres, consultez Ordre des opérations Tableau.

Les filtres offrent une flexibilité important, mais vous devriez les utiliser avec précaution. Ils peuvent être gourmands en termes de calcul. Par conséquent, le nombre de filtres peut améliorer les performances de classeur.

Filtrer vos données dans la source de données

Lorsque vous créez un filtre sur une source de données, réduisez la quantité de données dans la source de données. Pour les systèmes qui ont massivement recours aux partitions ou à l'indexation, les filtres de sources de données offrent un très haut niveau de contrôle sur les performances des requêtes émises par Tableau. Pour plus d'informations, consultez Filtrer les données de sources de données.

Utilisez les filtres Conserver uniquement au lieu des filtres Exclure.

Étant donné que les filtres Exclure chargent toutes les données pour une dimension, ils s'exécutent plus lentement que les filtres Conserver uniquement. Pour plus d'informations, consultez Choisir de conserver ou d'exclure des points de données dans votre vue(Le lien s’ouvre dans une nouvelle fenêtre).

Ajouter des filtres en premier

Si vous travaillez avec une source de données volumineuse et que les mises à jour automatiques sont désactivées, vous pouvez créer par inadvertance une requête très lente lors de l'ajout de filtres à la vue. Plutôt que de créer la vue puis de définir les filtres, commencez par définir les filtres avant de faire glisser les champs dans la vue. De cette manière, lors de l'exécution de la mise à jour ou de l'activation des mises à jour automatiques, les filtres sont évalués en premier.

Utiliser les filtres contextuels avec parcimonie

Considérez un filtre contextuel comme un filtre indépendant ; tous les autres filtres que vous définissez sont des filtres dépendants car ils traitent uniquement les données qui passent à travers le filtre contextuel. N'utilisez les filtres contextuels que s'ils limitent la taille de l'ensemble de données de manière importante. Si vous définissez des filtres qui réduisent de façon significative la taille de l'ensemble de données et qui seront utilisés pour plusieurs vues de données, vous devez les définir comme des filtres contextuels. Pour plus d'informations, consultez Améliorer les performances de la vue avec les filtres contextuels. Pour plus d'informations sur l'amélioration des performances à l'aide de filtres contextuels, consultez Accélérer les filtres contextuels.

Utiliser un ensemble pour filtrer les données

Si vous souhaitez filtrer une dimension pour supprimer des membres basés sur une plage de valeurs de mesures, vous devez créer un ensemble plutôt que d'utiliser un filtre quantitatif. Par exemple, vous pouvez créer un ensemble qui renvoie uniquement les 50 premiers éléments d'une dimension, plutôt que tous les éléments de celle-ci.

Lors de la création d'un groupe à partir d'une sélection, comme décrit dans Réunir vos données, vérifiez que vous avez inclus uniquement les colonnes qui vous intéressent. Chaque nouvel ajout de colonne dans l'ensemble entraîne une diminution des performances.

Agréger vos données à l'aide de SQL personnalisé

En tant qu'alternative aux filtres, une autre manière efficace de restreindre la quantité de données à analyser consiste à utiliser SQL personnalisé pour agréger les mesures avant d'envoyer les données dans Tableau. Supposons que vos données de vérification soient stockées dans une table SQL Server, et qu'à des fins d'analyse, vous êtes uniquement intéressé par les données des champs « rating » et « reviewer ID ». Pour pré-agréger les données pour que seuls les champs par lesquels vous êtes intéressés n'apparaissent dans Tableau, vous devrez peut-être utiliser le SQL personnalisé suivant :

Cette requête de SQL personnalisé réduit la quantité de données envoyée dans Tableau parce qu'elle pré-agrège les vérifications et fait la moyenne des valeurs dans les classements de vérification.

Filtrer vos données de cube

Voici quelques astuces spécifiques pour filtrer les données de cube.

Filtrer sur une dimension spécifique

Si votre cube possède une dimension importante, vous devez définir un filtre directement sur cette dimension plutôt que sur une autre dimension ou mesure. Par exemple, supposons que vous voulez réduire le nombre de produits affichés dans une vue. Il est beaucoup plus efficace de définir le filtre directement sur les produits ou de créer un ensemble calculé basé sur les poduits (comme le Top 10) plutôt que de filtrer les autres champs comme l'emplacement ou le profit.

De même, évitez la sélection de nombreux membres à partir d'une dimension importante. Lorsqu'une dimension est importante, il convient de conserver la taille du filtre à moins de 1 000 membres.

Créer un ensemble

Lors de la création d'un ensemble à partir d'une sélection, comme décrit dans la section Créer des ensembles, vérifiez que vous avez inclus uniquement les colonnes qui vous intéressent dans la boîte de dialogue Créer un ensemble. Chaque nouvel ajout de colonne dans le groupe entraîne une diminution des performances. Par exemple, si vous créez un ensemble qui contient toutes les régions avec des ventes entre 8 000 et 15 000, mais que vous incluez une colonne qui n'affecte pas les membres de l'ensemble, cela peut entraîner une diminution au niveau des performances. Pour supprimer une colonne inutile, cliquez sur celle-ci avec le bouton droit de la souris et sélectionnez Supprimer cette colonne dans le menu contextuel.

Ne pas appliquer les tris aux niveaux

Évitez d'appliquer les tris aux niveaux d'une hiérarchie très importante dans un cube.

Utiliser la commande Exclure

Si vous travaillez avec une dimension dont le niveau racine est supérieur à 1 000, mais qu'il n'est pas non plus trop important (moins de 100 000), évitez d'utiliser une boîte de dialogue de filtre pour filtrer les données. Au lieu de cela, faites glisser la dimension vers une étagère et utilisez la commande Exclure des menus contextuels des en-têtes pour limiter le nombre de données affichées dans la vue.

Merci de vos commentaires !