Agrégation de données dans Tableau
Dans Tableau, vous pouvez agréger des mesures ou une dimension, bien qu’il soit plus courant d’agréger des mesures. Dès que vous ajoutez une mesure à votre vue, une agrégation est appliquée à cette mesure par défaut. Le type d’agrégation appliquée varie selon le contexte de la vue.
Modifier l’agrégation d’une mesure dans la vue
Lorsque vous ajoutez une mesure à la vue, Tableau agrège automatiquement ces données. La somme, la moyenne et la médiane sont des agrégations courantes. Pour une liste complète, consultez Liste des agrégations prédéfinies dans Tableau.
L’agrégation active apparaît en tant que nom de la mesure dans la vue. Par exemple, Ventes devient SOMMES(Ventes). Chaque mesure possède une agrégation par défaut qui est définie par Tableau lorsque vous vous connectez à une source de données. Vous pouvez afficher ou modifier l’agrégation par défaut pour une mesure— consultez Définir l’agrégation par défaut pour une mesure.
Vous pouvez agréger des mesures à l’aide de Tableau uniquement pour des bases de données relationnelles. Les bases de données multidimensionnelles contiennent des données déjà agrégées. Dans Tableau, les sources de données multidimensionnelles sont uniquement prises en charge par Windows.
Vous pouvez modifier l’agrégation pour une mesure de la vue à partir du menu contextuel :
Agrégation de dimensions
Vous pouvez agréger une dimension dans la vue en tant que Minimum, Maximum, Total ou Total (Distinct). Lorsque vous agrégez une dimension, vous créez une nouvelle colonne de mesures temporaire, si bien que la dimension prend les caractéristiques d’une mesure.
Une autre façon d’afficher une dimension est de la traiter comme un attribut. Pour ce faire, choisissez Attribut dans le menu contextuel de la dimension. L’agrégation Attribut est associée à plusieurs utilisations :
- Elle peut assurer un niveau de détail cohérent lors de la combinaison de plusieurs sources de données.
- Elle peut fournir un moyen d’agréger des dimensions lors du traitement de calculs de table, qui requièrent une expression agrégée.
- Elle peut améliorer les performances des requêtes parce que le calcul est effectué
Tableau calcule la valeur Attribut à l’aide de la formule suivante :
IF MIN([dimension]) = MAX([dimension]) THEN
MIN([dimension]) ELSE "*" END
La formule est calculée dans Tableau une fois que les données sont récupérées à partir de la requête d’origine. En fait, l’astérisque (*) représente un indicateur visuel d’un type spécial de valeur nulle qui apparaît en présence de valeurs multiples. Consultez Résoudre les problèmes liés à la fusion des données(Le lien s’ouvre dans une nouvelle fenêtre) pour en savoir plus sur l’astérisque.
Voici un exemple de l’utilisation d’un attribut dans un calcul de table. La table affiche les ventes par marché, par taille du marché et par État. Imaginons que vous souhaitiez calculer le pourcentage des ventes totales que représente chaque Région sur le marché. Lorsque vous ajoutez un pourcentage du total de calculs de table rapides (voir Calculs de table rapides(Le lien s’ouvre dans une nouvelle fenêtre)) calculé dans la Région, le calcul s’effectue dans la zone rouge. Cela est dû au fait que la dimension Taille du marché partitionne les données.
Lorsque vous agrégez Taille du marché en tant qu’attribut, le calcul est effectué dans Marché (dans l’image suivante, il s’agit du marché de l’Est) et la taille du marché ne sert que d’étiquette.
Liste des agrégations prédéfinies dans Tableau
Il est parfois utile de consulter les données numériques sous une forme agrégée, par exemple en tant que somme ou moyenne. Les fonctions mathématiques produisant des données agrégées sont appelées fonctions d’agrégation. Les fonctions d’agrégation effectuent un calcul sur un ensemble de valeurs et renvoient une seule valeur. Par exemple, une mesure contenant les valeurs 1, 2, 3, 3, 4 agrégée en tant que somme renvoie une seule valeur : 13. Si vous disposez de 3 000 ventes de 50 produits, il peut être intéressant d’afficher la somme des ventes de chaque produit pour déterminer ceux qui représentent le chiffre d’affaires le plus élevé.
Remarque : L’utilisation de valeurs en virgule flottante avec des agrégations peut parfois produire des résultats inattendus. Pour plus de détails, consultez Comprendre les types de données dans les calculs Tableau(Le lien s’ouvre dans une nouvelle fenêtre).
Tableau dispose d’un ensemble d’agrégations prédéfinies visibles dans le tableau. Il est possible de définir l’agrégation par défaut pour toute mesure qui n’est pas un champ calculé contenant lui-même une agrégation, par exemple AVG([Discount])
. Consultez Définir l’agrégation par défaut pour une mesure Il est également possible de définir l’agrégation d’un champ déjà présent dans la vue. Pour plus de détails, consultez Modifier l’agrégation d’une mesure dans la vue.
Agrégation | Description | Résultat pour une mesure contenant 1, 2, 2, 3 |
---|---|---|
Attribut | Renvoie la valeur de l’expression donnée si elle comporte une seule valeur pour toutes les lignes du groupe. Dans le cas contraire, un astérisque (*) s’affiche. Les valeurs nulles sont ignorées. Cette agrégation est utile lors de l’agrégation d’une dimension. Pour définir une mesure de la vue sur cette agrégation, cliquez avec le bouton droit de la souris (contrôle-clic sur Mac) sur la mesure, puis choisissez Attribut. Le texte est modifié et affiche désormais ATTR : | * |
Dimension | Renvoie toutes les valeurs uniques dans une mesure ou une dimension. | 3 valeurs (1, 2, 3) |
Somme | Renvoie la somme des nombres dans une mesure. Les valeurs nulles sont ignorées. | 1 valeur (8) |
Moyenne | Renvoie la signification arithmétique des nombres présents dans une mesure. Les valeurs nulles sont ignorées. | 1 valeur (2) |
Total (distinct) | Renvoie le nombre de valeurs uniques présentes dans une mesure ou une dimension. Lorsqu’elle est appliquée à une dimension, Tableau crée une nouvelle colonne temporaire qui constitue une mesure (parce que le résultat d’un total est un nombre). Vous pouvez compter des nombres, des dates, des valeurs booléennes et des chaînes de caractères. Les valeurs nulles sont ignorées dans tous les cas. Cette agrégation n’est pas disponible pour les types de classeurs suivants :
Si vous êtes connecté à un classeur utilisant l’un de ces types, Total (Distinct) n’est pas disponible et Tableau affiche le message « Extrait nécessaire ». Pour utiliser cette agrégation, vous devez extraire vos données. Consultez la section Extraire vos données. | 1 valeur (3) |
Minimum | Renvoie le plus petit nombre présent dans une mesure ou une dimension continue. Les valeurs nulles sont ignorées. | 1 valeur (1) |
Maximum | Renvoie le nombre le plus grand dans une mesure ou dans l’expression donnée en fonction de la population d’un exemple. Les valeurs nulles sont ignorées. Renvoie une valeur nulle si moins de 2 membres ne sont pas nuls dans l’échantillon. Utilisez cette fonction si vos données correspondent à un échantillon de population. | 1 valeur (3) |
Dév. Std (Pop.) | Renvoie l’écart-type de toutes les valeurs de l’expression données en fonction d’une population biaisée. Suppose que ses arguments représentent la population entière. Utilisez cette fonction pour les échantillons conséquents. | 1 valeur (0,7071) |
Variance | Renvoie la variance de toutes les valeurs dans l’expression donnée en fonction d’un échantillon. Les valeurs nulles sont ignorées. Renvoie une valeur nulle si moins de 2 membres ne sont pas nuls dans l’échantillon. Utilisez cette fonction si vos données correspondent à un échantillon de population. | 1 valeur (0,6667) |
Variance (Pop.) | Renvoie la variance de toutes les valeurs de l’expression données en fonction d’une population biaisée. Suppose que ses arguments représentent la population entière. Utilisez cette fonction pour les échantillons conséquents. | 1 valeur (0,5000) |
Désagrégation | Renvoie tous les enregistrements présents dans les sources de données sous-jacentes. Pour désagréger toutes les mesures de la vue, sélectionnez Agréger les mesures dans le menu Analyse (pour décocher la case). Tableau vous permet d’afficher des données sous forme désagrégée (bases de données relationnelles uniquement). Lorsque les données sont désagrégées, vous pouvez afficher les différentes lignes de votre source de données. Par exemple, après avoir observé que la somme des ventes d’élastiques est de 14 600 dollars, vous pouvez analyser la répartition des transactions de ventes individuelles. Pour répondre à cette question, vous devez créer une vue qui affiche les lignes de données individuellement. Cela signifie qu’il est nécessaire de désagréger les données (consultez Comment désagréger les données). Pour consulter des données désagrégées, l’autre solution consiste à afficher les données de base pour tout ou partie d’une vue. Pour plus d’informations, consultez Afficher les données sous-jacentes. | 4 valeurs (1, 2, 2, 3) |
Vous pouvez également définir des agrégations personnalisées comme décrit dans Fonctions d’agrégation dans Tableau(Le lien s’ouvre dans une nouvelle fenêtre). En fonction du type de vue de données que vous créez, Tableau applique ces agrégations au niveau de détail approprié. Par exemple, Tableau appliquera l’agrégation individuellement aux membres d’une dimension (l’heure de livraison moyenne dans la zone géographique Est), à tous les membres d’une dimension donnée (heure de livraison moyenne dans les zones géographiques Est, Ouest et Centre), ou à des groupes de dimensions (la somme des ventes pour toutes les zones géographiques et tous les marchés).
Définir l’agrégation par défaut pour une mesure
Il est possible de définir l’agrégation par défaut pour toute mesure qui n’est pas un champ calculé contenant lui-même une agrégation, par exemple AVG([Discount])
. Il est préférable d’utiliser une agrégation par défaut pour résumer un champ continu ou discret. L’agrégation par défaut est utilisée automatiquement lorsque vous faites glisser une mesure vers une vue.
Pour modifier l’agrégation par défaut :
Cliquez avec le bouton droit de la souris (contrôle-clic sur Mac) sur une mesure dans le volet Données et sélectionnez Propriétés par défaut > Agrégation, puis sélectionnez l’une des options d’agrégation.
Remarque : avec Tableau, seules les bases de données relationnelles permettent d’agréger des mesures. Les sources de données multidimensionnelles contiennent uniquement des données agrégées.
Vous ne pouvez pas définir des agrégations par défaut pour les sources de données publiées. L’agrégation par défaut est définie lorsque la source de données est publiée initialement. Créez une copie locale(Le lien s’ouvre dans une nouvelle fenêtre) de la source de données publiée pour ajuster l’agrégation par défaut.
Comment désagréger les données
Dès que vous ajoutez une mesure à votre vue, une agrégation est appliquée à cette mesure par défaut. Cette mesure par défaut est contrôlée par le paramètre Agréger les mesures dans le menu Analyse.
Si vous décidez que vous souhaitez voir tous les repères de la vue au niveau de granularité le plus détaillé, vous pouvez désagréger la vue. La désagrégation de vos données signifie que Tableau affiche un repère séparé pour chaque valeur de données dans chaque ligne de votre source de données.
Pour désagréger toutes les mesures de la vue :
Décochez l’option Analyse >Agréger les mesures. Si elle est déjà cochée, cliquez une fois sur l’option Agréger les mesures pour la décocher.
Lorsque l’option Agréger les mesures est cochée, Tableau tente d’agréger les mesures dans la vue par défaut. Les différentes valeurs de ligne de votre source de données sont agrégées en une seule valeur (un seul repère) au niveau de détail de votre vue.
Les différentes agrégations disponibles pour une mesure déterminent la manière dont les valeurs individuelles sont collectées : elles peuvent faire l’objet d’une addition (SOMME), d’une moyenne (MOY) ou d’une définition sur la valeur maximum (MAX) ou minimum (MIN) à partir des valeurs de lignes individuelles.
Pour une liste complète des agrégations disponibles, consultez Liste des agrégations prédéfinies dans Tableau .
Le niveau de détail est déterminé par les dimensions dans votre vue. Pour en savoir plus sur le concept de niveau de détail, consultez Comment les dimensions affectent le niveau de détail dans la vue.
La désagrégation de vos données peut être utile lorsque vous analysez des mesures que vous voulez utiliser à la fois de façon dépendante et indépendante dans la vue. Par exemple, vous êtes en train d’analyser les résultats d’une enquête de satisfaction produit avec l’âge des participants le long d’un des axes. Vous pouvez agréger le champ Âge afin de déterminer l’âge moyen des participants, ou bien désagréger les données pour déterminer à quel âge les participants ont été le plus satisfaits du produit.
La désagrégation des données peut être utile lorsque vous affichez des données sous forme de nuage de points. Consultez Exemple : nuages de points, agrégation et granularité.
Remarque : Si votre source de données est très volumineuse, la désagrégation des données peut engendrer une diminution importante des performances.
Exemple : nuages de points, agrégation et granularité
Si vous placez une mesure sur l’étagère Lignes et une autre sur l’étagère Colonnes, vous demandez à Tableau de comparer deux valeurs numériques. Généralement, dans ce genre de situation, Tableau choisit un nuage de points en tant que visualisation par défaut. La vue initiale contiendra très probablement un seul repère, affichant la somme de toutes les valeurs pour les deux mesures. La raison est que vous devez augmenter le niveau de détail de la vue.
Commencer à créer le nuage de points
Utiliser des dimensions pour ajouter des détails
Essayer d’ajouter des champs aux étagères Lignes et Colonnes
Commencer à créer le nuage de points
Plusieurs solutions sont possibles pour ajouter des renseignements à un nuage de points de base : vous pouvez utiliser des dimensions pour ajouter des renseignements, ajouter des champs supplémentaires aux étagères Lignes et Colonnes, ou encore désagréger les données. Vous pouvez également associer ces options. Cette rubrique examine ces alternatives en utilisant la source de données Sample - Superstore.
Pour créer la vue initiale, procédez comme suit :
Placez la mesure Ventes sur l’étagère Colonnes.
Placez la mesure Profit sur l’étagère Lignes.
Les mesures sont automatiquement agrégées en tant que sommes. L’agrégation par défaut (SOMME) est indiquée dans les noms des champs. Les valeurs affichées dans les infobulles montrent la somme des valeurs des ventes et du bénéfice dans toutes les lignes de la source de données.
Suivez la procédure ci-dessous pour utiliser des dimensions afin d’ajouter des détails à la vue et de désagréger des données.
Utiliser des dimensions pour ajouter des détails
Pour développer la vue nuage de points créée, suivez cette procédure en ajoutant des dimensions pour afficher plus de niveaux de détail.
Faites glisser la dimension Catégorie vers Couleur sur la fiche Repères.
Cette méthode sépare les données en trois repères (un par membre de dimension) et encode les repères à l’aide de couleurs.
Faites glisser la dimension Région vers Détail sur la fiche Repères.
Les repères présents dans la vue sont désormais plus nombreux. Le nombre de repères est égal au nombre d’états distincts dans la source de données multiplié par le nombre de catégories.
Bien que plus de repères soient désormais affichés, les mesures sont toujours agrégées. Par conséquent, quel que soit le nombre de lignes dans la source de données présentant l’information Région = Dakota du Nord et Catégorie = Mobilier, ou 100 lignes de ce type, le résultat est toujours un seul repère.
Il se peut que ce processus développe la vue d’une manière qui peut vous convenir. Si cela n’est pas le cas, il est possible de procéder autrement. C’est vous qui décidez. Vous déterminez les questions à poser.
Essayer d’ajouter des champs aux étagères Lignes et Colonnes
Revenez à la vue d’origine à un repère et suivez cette procédure pour développer la vue du nuage de points en ajoutant des champs aux étagères Lignes et Colonnes.
Faites glisser la dimension Région vers l’étagère Colonnes.
Même si vous déposez Continent à droite de SOMME(Ventes), Tableau le déplace à gauche de SOMME(Ventes). Cela est dû au fait qu’il est impossible d’insérer une dimension dans un axe continu. Au lieu de cela, vos vues affichent un axe distinct pour chaque membre de la dimension.
Faites glisser la dimension Segment vers l’étagère Lignes.
Vous disposez désormais d’une vue qui offre une vue d’ensemble des ventes et des bénéfices dans toutes les Régions et les segments de clients. Il peut être intéressant de pointer la souris sur les repères dans la vue pour voir des données d’infobulles pour différents segments :
Essayer de désagréger les données
Une autre solution pour modifier le nuage de points ne comportant qu’un seul repère consiste à désagréger les données.
Décochez l’option Analyse >Agréger les mesures. Si elle est déjà cochée, cliquez une fois sur l’option Agréger les mesures pour la décocher.
Vous avez ainsi désagrégé les données, car cette commande est un basculement sélectionné à l’origine (coche présente). Par défaut, Tableau agrège des données dans votre vue.
De nombreux repères apparaissent désormais, un par ligne dans votre source de données d’origine :
Lorsque vous désagrégez des mesures, ce ne sont plus la moyenne ni la somme des valeurs qui apparaissent dans les lignes de la source de données. Au contraire, la vue affiche un repère pour chaque ligne de la source de données. La désagrégation des données est un moyen de consulter l’ensemble des données. Elle constitue une manière rapide de comprendre la forme de vos données et d’identifier les valeurs atypiques. Dans ce cas, la vue montre qu’il existe une relation cohérente entre le chiffre d’affaires et le bénéfice, comme l’indique la présence d’une ligne de repères inclinée de 45°.