Agrégation de données dans Tableau
Dans Tableau, vous pouvez agréger des mesures ou des dimensions, bien qu’il soit plus courant d’agréger des mesures. Dès que vous ajoutez une mesure à votre vue, une agrégation est appliquée à cette mesure par défaut. Le type d’agrégation appliquée varie selon le contexte de la vue.
Modifier l’agrégation d’une mesure dans la vue
Lorsque vous ajoutez une mesure à la vue, Tableau agrège automatiquement ces données. La somme, la moyenne et la médiane sont des agrégations courantes. Pour une liste complète, consultez Liste des agrégations prédéfinies dans Tableau.
L’agrégation active apparaît en tant que nom de la mesure dans la vue. Par exemple, Sales devient SUM(Sales). Chaque mesure a une agrégation par défaut qui est définie par Tableau lorsque vous vous connectez à une source de données. Vous pouvez afficher ou modifier l’agrégation par défaut pour une mesure— consultez Définir l’agrégation par défaut pour une mesure.
Vous pouvez agréger des mesures à l’aide de Tableau uniquement pour des sources de données relationnelles. Les bases de données multidimensionnelles contiennent des données déjà agrégées. Dans Tableau, les sources de données multidimensionnelles sont uniquement prises en charge par Windows.
Vous pouvez modifier l’agrégation pour une mesure de la vue à partir du menu contextuel :
Agrégation de dimensions
Vous pouvez agréger une dimension dans la vue en tant que Minimum, Maximum, Total ou Total (Distinct). Lorsque vous agrégez une dimension, vous créez une nouvelle colonne de mesures temporaire, si bien que la dimension prend les caractéristiques d’une mesure.
Une autre façon d’afficher une dimension consiste à la traiter comme un attribut en choisissant Attribut dans le menu contextuel de la dimension. L’agrégation Attribut est associée à plusieurs utilisations :
- Elle peut assurer un niveau de détail cohérent lors de la combinaison de plusieurs sources de données.
- Elle peut fournir un moyen d’agréger des dimensions lors du traitement de calculs de table, qui requièrent une expression agrégée.
- Elle peut améliorer les performances des requêtes parce que le calcul est effectué localement.
Tableau calcule la valeur Attribut à l’aide de la formule suivante :
IF MIN([dimension]) = MAX([dimension]) THEN
MIN([dimension]) ELSE "*" END
La formule est calculée dans Tableau une fois que les données sont récupérées à partir de la requête d’origine. En fait, l’astérisque (*) représente un indicateur visuel d’un type spécial de valeur nulle qui apparaît en présence de valeurs multiples. Consultez Résoudre les problèmes liés à la fusion des données(Le lien s’ouvre dans une nouvelle fenêtre) pour en savoir plus sur l’astérisque.
Voici un exemple d’utilisation d’un attribut dans un calcul de table. La table affiche les ventes par marché, par taille du marché et par État. Imaginons que vous souhaitiez calculer le pourcentage des ventes totales que représente chaque État sur le marché. Lorsque vous ajoutez un calcul de table rapide Pourcentage du total (voir Calculs de table rapides(Le lien s’ouvre dans une nouvelle fenêtre)) qui exécute un calcul dans État, le calcul s’effectue dans la zone rouge. Cela est dû au fait que la dimension Taille du marché partitionne les données.
Lorsque vous agrégez Market Size en tant qu’attribut, le calcul est effectué dans Market (dans l’image suivante, il s’agit du marché East) et les informations sur la taille du marché s’affichent uniquement en tant qu’étiquette.
Liste des agrégations prédéfinies dans Tableau
Il est parfois utile de consulter les données numériques sous une forme agrégée, par exemple en tant que somme ou moyenne. Les fonctions mathématiques produisant des données agrégées sont appelées fonctions d’agrégation. Les fonctions d’agrégation effectuent un calcul sur un ensemble de valeurs et renvoient une seule valeur. Par exemple, une mesure contenant les valeurs 1, 2, 3, 3, 4 agrégée en tant que somme renvoie une seule valeur : 13. Si vos ventes totalisent 3000 transactions pour 50 produits, il peut être intéressant d’afficher la somme des ventes par produit afin d’identifier ceux qui génèrent le chiffre d’affaires le plus élevé.
Remarque : l’utilisation de valeurs à virgule flottante en combinaison avec des agrégations peut parfois produire des résultats inattendus. Pour plus de détails, consultez Comprendre les types de données dans les calculs Tableau(Le lien s’ouvre dans une nouvelle fenêtre).
Tableau fournit un ensemble d’agrégations prédéfinies présentées dans le tableau ci-après. Vous pouvez configurer l’agrégation par défaut pour toute mesure qui n’est pas un champ calculé contenant lui-même une agrégation, par exemple AVG([Discount])
. Consultez Définir l’agrégation par défaut pour une mesure Il est également possible de définir l’agrégation d’un champ déjà présent dans la vue. Pour plus de détails, consultez Modifier l’agrégation d’une mesure dans la vue.
Agrégation | Description | Résultat pour une mesure contenant 1, 2, 2, 3 |
---|---|---|
Attribut | Renvoie la valeur de l’expression donnée si elle comporte une seule valeur pour toutes les lignes du groupe. Dans le cas contraire, un astérisque (*) s’affiche. Les valeurs null sont ignorées. Cette agrégation est utile lors de l’agrégation d’une dimension. Pour définir une mesure de la vue sur cette agrégation, cliquez avec le bouton droit de la souris (contrôle-clic sur Mac) sur la mesure, puis choisissez Attribut. Le texte est modifié et affiche désormais ATTR: | * |
Dimension | Renvoie toutes les valeurs uniques dans une mesure ou une dimension. | 3 valeurs (1, 2, 3) |
Somme | Renvoie la somme des nombres dans une mesure. Les valeurs null sont ignorées. | 1 valeur (8) |
Moyenne | Renvoie la signification arithmétique des nombres présents dans une mesure. Les valeurs null sont ignorées. | 1 valeur (2) |
Total (distinct) | Renvoie le nombre de valeurs uniques présentes dans une mesure ou une dimension. Lorsqu’elle est appliquée à une dimension, Tableau crée une nouvelle colonne temporaire qui constitue une mesure (parce que le résultat d’un total est un nombre). Vous pouvez compter des nombres, des dates, des valeurs booléennes et des chaînes de caractères. Les valeurs null sont ignorées dans tous les cas. Cette agrégation n’est pas disponible pour les types de classeurs suivants :
Si vous êtes connecté à un classeur utilisant l’un de ces types, la fonction Total (distinct) n’est pas disponible et Tableau affiche le message « Extrait nécessaire ». Pour utiliser cette agrégation, vous devez extraire vos données. Consultez la section Extraire vos données. | 1 valeur (3) |
Minimum | Renvoie le plus petit nombre présent dans une mesure ou une dimension continue. Les valeurs null sont ignorées. | 1 valeur (1) |
Maximum | Renvoie le nombre le plus grand dans une mesure ou dans l’expression donnée en fonction de la population d’un exemple. Les valeurs null sont ignorées. Renvoie une valeur null si l’échantillon contient moins de 2 membres non nuls. Utilisez cette fonction si vos données correspondent à un échantillon de population. | 1 valeur (3) |
Dév. Std (Pop.) | Renvoie l’écart-type de toutes les valeurs de l’expression données en fonction d’une population biaisée. Suppose que ses arguments représentent la population entière. Utilisez cette fonction pour les échantillons conséquents. | 1 valeur (0,7071) |
Variance | Renvoie la variance de toutes les valeurs dans l’expression donnée en fonction d’un échantillon. Les valeurs null sont ignorées. Renvoie une valeur nulle si moins de 2 membres ne sont pas nuls dans l’échantillon. Utilisez cette fonction si vos données correspondent à un échantillon de population. | 1 valeur (0,6667) |
Variance (Pop.) | Renvoie la variance de toutes les valeurs de l’expression données en fonction d’une population biaisée. Suppose que ses arguments représentent la population entière. Utilisez cette fonction pour les échantillons conséquents. | 1 valeur (0,5000) |
Désagrégation | Renvoie tous les enregistrements présents dans les données de base. Pour désagréger toutes les mesures de la vue, sélectionnez Agrégation des mesures dans le menu Analyse (pour décocher la case). Tableau vous permet d’afficher des données sous forme désagrégée (bases de données relationnelles uniquement). Lorsque les données sont désagrégées, vous pouvez afficher les lignes individuelles de votre source de données. Par exemple, après avoir observé que la somme des ventes d’élastiques est de 14 600 dollars, vous pouvez analyser la répartition des transactions de ventes individuelles. Pour répondre à cette question, vous devez créer une vue qui affiche les lignes de données individuellement. Cela signifie que vous devez désagréger les données (consultez Comment désagréger les données). Pour consulter des données désagrégées, l’autre solution consiste à afficher les données de base pour tout ou partie d’une vue. Pour plus d’informations, consultez Afficher les données sous-jacentes. | 4 valeurs (1, 2, 2, 3) |
Vous pouvez également définir des agrégations personnalisées comme décrit dans Fonctions d’agrégation dans Tableau(Le lien s’ouvre dans une nouvelle fenêtre). En fonction du type de vue de données que vous créez, Tableau applique ces agrégations au niveau de détail approprié. Par exemple, Tableau applique l’agrégation à des membres individuels d’une dimension (l’heure de livraison moyenne dans la région Est), à tous les membres d’une dimension donnée (heure de livraison moyenne dans les régions Est, Ouest et Centre) ou à des groupes de dimensions (la somme des ventes pour toutes les régions et tous les marchés).
Définir l’agrégation par défaut pour une mesure
Vous pouvez configurer l’agrégation par défaut pour toute mesure qui n’est pas un champ calculé contenant lui-même une agrégation, par exemple AVG([Discount])
. Il est préférable d’utiliser une agrégation par défaut pour résumer un champ continu ou discret. L’agrégation par défaut est utilisée automatiquement lorsque vous faites glisser une mesure vers une vue.
Pour modifier l’agrégation par défaut :
Cliquez avec le bouton droit de la souris (contrôle-clic sur Mac) sur une mesure dans le volet Données et sélectionnez Propriétés par défaut > Agrégation, puis sélectionnez l’une des options d’agrégation.
Remarque : avec Tableau, seules les sources de données relationnelles permettent d’agréger des mesures. Les bases de données multidimensionnelles contiennent uniquement des données agrégées.
Vous ne pouvez pas définir des agrégations par défaut pour les sources de données publiées. L’agrégation par défaut est définie lorsque la source de données est publiée initialement. Créez une copie locale(Le lien s’ouvre dans une nouvelle fenêtre) de la source de données publiée pour ajuster l’agrégation par défaut.
Comment désagréger les données
Dès que vous ajoutez une mesure à votre vue, une agrégation est appliquée à cette mesure par défaut. Cette mesure par défaut est contrôlée par le paramètre Agréger les mesures dans le menu Analyse.
Si vous décidez que vous souhaitez voir tous les repères de la vue au niveau de granularité le plus détaillé, vous pouvez désagréger la vue. La désagrégation de vos données signifie que Tableau affichera un repère séparé pour chaque valeur de données dans chaque ligne de votre source de données.
Pour désagréger toutes les mesures de la vue :
Désélectionnez l’option Analyse >Agréger les mesures. Si elle est déjà sélectionnée, cliquez une fois sur l’option Agréger les mesures pour la désélectionner.
Lorsque l’option Agréger les mesures est sélectionnée, Tableau tente d’agréger les mesures de la vue par défaut. Les valeurs de ligne individuelles de votre source de données sont regroupées en une seule valeur (un seul repère) au niveau de détail de votre vue.
Les différentes agrégations disponibles pour une mesure déterminent la manière dont les valeurs individuelles sont collectées : elles peuvent être faire l’objet d’une addition (SUM), d’une moyenne (AVG) ou d’une définition sur la valeur maximum (MAX) ou minimum (MIN) à partir des valeurs de lignes individuelles.
Pour une liste complète des agrégations disponibles, consultez Liste des agrégations prédéfinies dans Tableau .
Le niveau de détail est déterminé par les dimensions dans votre vue. Pour des informations sur le concept de niveau de détail, consultez Comment les dimensions affectent le niveau de détail dans la vue.
La désagrégation de vos données peut être utile lorsque vous analysez des mesures que vous voulez utiliser à la fois de façon dépendante et indépendante dans la vue. Par exemple, vous êtes en train d’analyser les résultats d’une enquête de satisfaction produit avec l’âge des participants le long d’un des axes. Vous pouvez agréger le champ Âge afin de déterminer l’âge moyen des participants, ou bien désagréger les données pour déterminer à quel âge les participants ont été le plus satisfaits du produit.
La désagrégation des données peut être utile lorsque vous affichez des données sous forme de nuage de points. Consultez Exemple : nuages de points, agrégation et granularité.
Remarque : Si votre source de données est très volumineuse, la désagrégation des données peut engendrer une diminution importante des performances.
Exemple : nuages de points, agrégation et granularité
Si vous placez une mesure sur l’étagère Lignes et une autre sur l’étagère Colonnes, vous demandez à Tableau de comparer deux valeurs numériques. Généralement, dans ce genre de situation, Tableau choisit un nuage de points en tant que visualisation par défaut. La vue initiale contiendra très probablement un seul repère, affichant la somme de toutes les valeurs pour les deux mesures. La raison est que vous devez augmenter le niveau de détail de la vue.
Commencer à créer le nuage de points
Utiliser des dimensions pour ajouter des détails
Essayer d’ajouter des champs aux étagères Lignes et Colonnes
Commencer à créer le nuage de points
Plusieurs solutions sont possibles pour ajouter des informations à un nuage de points de base : vous pouvez utiliser des dimensions pour ajouter des informations, ajouter des champs supplémentaires aux étagères Lignes et Colonnes ou encore désagréger les données. Vous pouvez également associer ces options. Cette rubrique examine ces alternatives en utilisant la source de données Sample-Superstore.
Pour créer la vue initiale, procédez comme suit :
Placez la mesure Sales sur l’étagère des colonnes.
Placez la mesure Profit sur l’étagère des lignes.
Les mesures sont automatiquement agrégées en tant que sommes. L’agrégation par défaut (SUM) est indiquée dans les noms des champs. Les valeurs affichées dans les infobulles montrent la somme des valeurs des ventes et du bénéfice dans toutes les lignes de la source de données.
Suivez la procédure ci-dessous pour utiliser des dimensions afin d’ajouter des détails à la vue et de désagréger des données.
Utiliser des dimensions pour ajouter des détails
Pour développer la vue de nuage de points que vous avez créée, suivez cette procédure en ajoutant des dimensions afin d’afficher des niveaux de détail supplémentaires.
Faites glisser la dimension Catégorie vers Couleur sur la fiche Repères.
Cette méthode sépare les données en trois repères (un par membre de la dimension), puis encode les repères à l’aide de couleurs.
Faites glisser la dimension État vers Détail sur la fiche Repères.
Les repères présents dans la vue sont désormais plus nombreux. Le nombre de repères est égal au nombre d’états distincts dans la source de données multiplié par le nombre de catégories.
Bien que plus de repères soient désormais affichés, les mesures sont toujours agrégées. Par conséquent, quel que soit le nombre de lignes dans la source de données présentant les informations État = Dakota du Nord et Catégorie = Mobilier, ou 100 lignes de ce type, le résultat est toujours un seul repère.
Peut-être que ce processus développe la vue dans une direction que vous jugez utile, ou peut-être préférez-vous aller dans une direction différente. C’est vous qui décidez. Vous déterminez les questions à poser.
Essayer d’ajouter des champs aux étagères Lignes et Colonnes
Revenez à la vue d’origine à un repère et suivez cette procédure pour développer la vue du nuage de points en ajoutant des champs aux étagères Lignes et Colonnes.
Faites glisser la dimension État vers l’étagère Colonnes.
Même si vous déposez Continent à droite de SUM(Sales), Tableau le déplace à gauche de SUM(Sales). Cela est dû au fait qu’il est impossible d’insérer une dimension dans un axe continu. Au lieu de cela, vos vues affichent un axe distinct pour chaque membre de la dimension.
Faites glisser la dimension Segment vers l’étagère Lignes.
Vous disposez désormais d’une vue qui offre une vue d’ensemble des ventes et des bénéfices dans tous les États et les segments de clients. Il peut être intéressant de pointer la souris sur les repères dans la vue pour voir des données d’infobulles pour différents segments :
Essayer de désagréger les données
Une autre solution pour modifier le nuage de points ne comportant qu’un seul repère consiste à désagréger les données.
Désélectionnez l’option Analyse >Agréger les mesures. Si elle est déjà sélectionnée, cliquez une fois sur l’option Agréger les mesures pour la désélectionner.
Vous avez ainsi désagrégé les données, car cette commande est un commutateur qui a été sélectionné à l’origine (coche présente). Par défaut, Tableau agrège des données dans votre vue.
De nombreux repères apparaissent désormais, un par ligne dans votre source de données d’origine :
Lorsque vous désagrégez des mesures, ce ne sont plus la moyenne ni la somme des valeurs qui apparaissent dans les lignes de la source de données. Au contraire, la vue affiche un repère pour chaque ligne de la source de données. La désagrégation des données est un moyen de consulter l’ensemble des données. Elle constitue une manière rapide de comprendre la forme de vos données et d’identifier les aberrations. Dans ce cas, la vue montre qu’il existe une relation cohérente entre le chiffre d’affaires et le profit, indiquée par une ligne de repères inclinée à un angle de 45°.