Fonctions d’agrégation dans Tableau
Cet article présente les fonctions d’agrégation et leurs utilisations dans Tableau. Il montre également comment créer un calcul agrégé en utilisant un exemple.
Pourquoi utiliser des fonctions d’agrégation
Les fonctions d’agrégation vous permettent de synthétiser ou de modifier la granularité de vos données.
Par exemple, vous souhaitez peut-être connaître le nombre exact de commandes reçues par votre magasin pour une année donnée. Vous pouvez utiliser la fonction COUNTD pour comptabiliser le nombre exact de commandes uniques reçues par votre entreprise, puis décomposer la visualisation par année.
Le calcul peut se présenter ainsi :
COUNTD(Order ID)
Le visualisation peut se présenter ainsi :
Fonctions d’agrégation disponibles dans Tableau
Agrégations et arithmétique à virgule flottante : Certaines agrégations peuvent donner des résultats inattendus. Par exemple, il se peut que la fonction SUM renvoie une valeur telle que -1.42e-14 pour une colonne de nombres dont la somme devrait logiquement être 0. En voici l’explication : la norme en virgule flottante 754 de l’IEEE (Institut des ingénieurs électriciens et électroniciens) exige que les nombres soient enregistrés dans un format binaire, ce qui signifie qu’ils sont parfois arrondis à des niveaux de précision très fins. Vous pouvez éviter cette distraction potentielle en utilisant la fonction ROUND (reportez-vous à la rubrique Fonctions de nombre) ou en mettant en forme le nombre de manière à afficher moins de décimales.
ATTR
Syntaxe | ATTR(expression) |
Définition | Renvoie la valeur de l’expression si cette valeur est unique pour toutes les lignes. Dans le cas contraire, la valeur renvoyée est Null. Les valeurs null sont ignorées. |
AVG
Syntaxe | AVG(expression) |
Définition | Renvoie la moyenne de toutes les valeurs de l’expression. Les valeurs null sont ignorées. |
Remarques | AVG peut uniquement être utilisé avec des champs numériques. |
COLLECT
Syntaxe | COLLECT(spatial) |
Définition | Un calcul agrégé combinant les valeurs dans le champ d’argument. Les valeurs null sont ignorées. |
Remarques | COLLECT peut uniquement être utilisé avec des champs de données spatiales. |
CORR
Syntaxe | CORR(expression1, expression2) |
Résultat | Nombre de -1 à 1 |
Définition | Renvoie le coefficient de corrélation Pearson de deux expressions. |
Exemple | example |
Remarques | La corrélation Pearson mesure la relation linéaire entre les deux variables. Les résultats vont de -1 à +1 inclus, où 1 dénote une relation linéaire positive exacte, 0 ne dénote aucune relation linéaire entre la variance, et -1 est une relation négative exacte. Le carré d’un résultat CORR est équivalent à la valeur R au carré pour un modèle de courbe de tendance linéaire. Consultez Termes relatifs aux modèles de courbe de tendance(Le lien s’ouvre dans une nouvelle fenêtre). À utiliser avec les expressions LOD au niveau d’une table : Vous pouvez utiliser CORR pour visualiser la corrélation dans une dispersion désagrégée à l’aide d’une expression du niveau de détail à l’échelle d’une table(Le lien s’ouvre dans une nouvelle fenêtre). Par exemple : {CORR(Sales, Profit)} Avec une expression de niveau de détail, la corrélation est exécutée sur toutes les lignes. Si vous avez utilisé une formule telle que |
Limitations de la base de données |
Pour les autres sources de données, vous pouvez envisager d’extraire les données à l’aide de |
COUNT
Syntaxe | COUNT(expression) |
Définition | Renvoie le nombre d’éléments. Les valeurs null sont ignorées. |
COUNTD
Syntaxe | COUNTD(expression) |
Définition | Renvoie le nombre d’éléments distincts d’un groupe. Les valeurs null sont ignorées. |
COVAR
Syntaxe | COVAR(expression1, expression2) |
Définition | Renvoie la covariance d’échantillon de deux expressions. |
Remarques | La covariance quantifie dans quelle mesure les deux variables changent ensemble. Une covariance positive indique que les variables tendent à évoluer dans la même direction, comme lorsque des valeurs plus importantes d’une variable tendent à correspondre à des valeurs plus importantes de l’autre variable, en moyenne. La covariance d’échantillon utilise le nombre de points de données non null n - 1 pour normaliser le calcul de la covariance, plutôt que n, qui est utilisé par la covariance de population (disponible avec la fonction Si La valeur de |
Limitations de la base de données |
Pour les autres sources de données, vous pouvez envisager d’extraire les données à l’aide de |
COVARP
Syntaxe | COVARP(expression 1, expression2) |
Définition | Renvoie la covariance de population de deux expressions. |
Remarques | La covariance quantifie dans quelle mesure les deux variables changent ensemble. Une covariance positive indique que les variables tendent à évoluer dans la même direction, comme lorsque des valeurs plus importantes d’une variable tendent à correspondre à des valeurs plus importantes de l’autre variable, en moyenne. La covariance de population est une covariance d’échantillon multipliée par (n-1)/n, où n est le nombre total de points de données non null. La covariance de population est le choix approprié dans les cas où des données sont disponibles pour tous les points d’intérêt par opposition aux cas où il n’existe qu’un sous-ensemble aléatoire d’éléments, dans quel cas la covariance d’échantillon (avec la fonction Si |
Limitations de la base de données |
Pour les autres sources de données, vous pouvez envisager d’extraire les données à l’aide de |
MAX
Syntaxe | MAX(expression) ou MAX(expr1, expr2) |
Résultat | Même type de données que l’argument, ou NULL si une partie de l’argument est une valeur null. |
Définition | Renvoie la valeur maximum des deux arguments, qui doivent être du même type de données.
|
Exemple | MAX(4,7) = 7 |
Remarques | Pour les chaînes
Pour les sources de données de base de données, la valeur de la chaîne Pour les dates Pour les dates, En tant qu’agrégation
En tant que comparaison
Voir également |
MEDIAN
Syntaxe | MEDIAN(expression) |
Définition | Renvoie la valeur médiane d’une expression dans tous les enregistrements. Les valeurs null sont ignorées. |
Remarques | MEDIAN peut uniquement être utilisé avec des champs numériques. |
Limitations de la base de données |
Pour d’autres types de sources de données, vous pouvez extraire vos données dans un fichier d’extrait pour utiliser cette fonction. Voir Extraire vos données(Le lien s’ouvre dans une nouvelle fenêtre). |
MIN
Syntaxe | MIN(expression) ou MIN(expr1, expr2) |
Résultat | Même type de données que l’argument, ou NULL si une partie de l’argument est une valeur null. |
Définition | Renvoie la valeur minimum des deux arguments, qui doivent être du même type de données.
|
Exemple | MIN(4,7) = 4 |
Remarques | Pour les chaînes
Pour les sources de données de base de données, la valeur de la chaîne Pour les dates Pour les dates, En tant qu’agrégation
En tant que comparaison
Voir également |
PERCENTILE
Syntaxe | PERCENTILE(expression, number) |
Définition | Renvoie la valeur du centile pour l’expression donnée correspondant au <number> indiqué. Le <number> doit être compris entre 0 et 1 (inclus) et doit être une constante numérique. |
Exemple | PERCENTILE([Score], 0.9) |
Limitations de la base de données | Cette fonction est disponible pour les sources de données suivantes : connexions Microsoft Excel et fichiers texte non héritées, types de sources de données Extraits et Non-extraits uniquement (par exemple, Google Analytics, OData ou Salesforce), sources de données Sybase IQ 15.1 et versions ultérieures, Oracle 10 et versions ultérieures, sources de données Cloudera Hive et Hortonworks Hadoop Hive, sources de données EXASolution 4.2 et versions ultérieures. Pour d’autres types de sources de données, vous pouvez extraire vos données dans un fichier d’extrait pour utiliser cette fonction. Voir Extraire vos données(Le lien s’ouvre dans une nouvelle fenêtre). |
STDEV
Syntaxe | STDEV(expression) |
Définition | Renvoie l’écart-type statistique de toutes les valeurs dans l’expression donnée en fonction d’un échantillon de population. |
STDEVP
Syntaxe | STDEVP(expression) |
Définition | Renvoie l’écart-type statistique de toutes les valeurs dans l’expression donnée en fonction d’une population biaisée. |
SUM
Syntaxe | SUM(expression) |
Définition | Renvoie la somme de toutes les valeurs de l’expression. Les valeurs null sont ignorées. |
Remarques | SUM peut uniquement être utilisé avec des champs numériques. |
VAR
Syntaxe | VAR(expression) |
Définition | Renvoie la variance statistique de toutes les valeurs dans l’expression donnée en fonction d’un échantillon de population. |
VARP
Syntaxe | VARP(expression) |
Définition | Renvoie la variance statistique de toutes les valeurs dans l’expression donnée de la totalité de la population. |
Créer un calcul agrégé
Suivez les étapes ci-dessous pour apprendre à créer un calcul agrégé.
- Dans Tableau Desktop, connectez-vous à la source de données Exemple - Hypermarché enregistrée qui est fournie avec Tableau.
- Accédez à une feuille de calcul et sélectionnez Analyse > Créer un champ calculé.
- Dans l’éditeur de calcul qui s’ouvre, procédez comme suit :
- Nommez le champ calculé Marge.
- Entrez la formule suivante :
IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)
Remarque : vous pouvez utiliser la référence des fonctions pour trouver et ajouter des fonctions d’agrégation et autres fonctions (par exemple la fonction IIF logique dans cet exemple) à la formule de calcul. Pour plus d’informations, consultez Utiliser la référence de fonctions dans l’éditeur de calcul.
- Lorsque vous avez terminé, cliquez sur OK.
Le nouveau calcul agrégé apparaît sous Mesures dans le volet Données. Comme vos autres champs, vous pouvez l’utiliser dans une ou plusieurs visualisations.
Remarque : les calculs agrégés sont toujours des mesures.
Lorsque Marge est placé sur une étagère ou une fiche dans la feuille de calcul, son nom est remplacé par AGG(Marge), ce qui indique qu’il s’agit d’un calcul agrégé et ne peut pas être agrégé davantage.
Règles pour les calculs agrégés
Les règles qui s’appliquent aux calculs agrégés sont les suivantes :
- Pour tout calcul agrégé, il est impossible de combiner une valeur agrégée avec une valeur désagrégée. Par exemple,
SUM(Price)*[Items]
n’est pas une expression valide parce que SUM(Prix) est agrégé, mais pas Articles. Cependant, les expressionsSUM(Price*Items)
etSUM(Price)*SUM(Items)
sont toutes deux valides. - Les constantes dans une expression font office de valeurs agrégées ou désagrégées, selon le cas. Par exemple :
SUM(Price*7)
etSUM(Price)*7
sont toutes deux des expressions valides. - Toutes les fonctions peuvent être évaluées sur des valeurs agrégées. Cependant, les arguments d’une fonction donnée doivent tous être agrégés ou désagrégés. Par exemple :
MAX(SUM(Sales),Profit)
n’est pas une expression valide parce que Ventes est agrégé, mais pas Profit. Cependant,MAX(SUM(Sales),SUM(Profit))
est une expression valide. - Le résultat d’un calcul d’agrégation est toujours une mesure. Cela inclut des expressions telles que ATTR(Dimension) ou MIN(Dimension).
- Comme les agrégations prédéfinies, les calculs d’agrégation sont calculés correctement pour les totaux généraux. Pour plus d’informations, consultez la section Totaux généraux.
Voir également
Comprendre les calculs : Calculs agrégés(Le lien s’ouvre dans une nouvelle fenêtre)
Agrégation de données dans Tableau(Le lien s’ouvre dans une nouvelle fenêtre)
Fonctions de Tableau (par catégorie)(Le lien s’ouvre dans une nouvelle fenêtre)