Calculer les scores Z
En statistiques, le score z (ou score standard) d’une observation désigne le nombre d’écarts-types qui se trouve au-dessus ou en dessous de la moyenne de la population.
Pour calculer un résultat z, vous devez connaître la moyenne de population et l’écart-type de population. Pour les cas où il est impossible de mesurer chaque observation d’une population, vous pouvez estimer l’écart-type à l’aide d’un exemple aléatoire.
Créer une visualisation de score z pour répondre aux questions du type suivant :
Quel pourcentage de valeurs est-il inférieur à une valeur spécifique ?
Quelles valeurs peuvent être considérées comme exceptionnelles ? Par exemple, dans un test de QI, quels scores représentent les 5 % supérieurs ?
Quel est le score relatif d’une distribution par rapport à une autre ? Par exemple, Michael est plus grand que la moyenne des hommes, et Emily est plus grande que la moyenne des femmes, mais qui est plus grand relativement dans son sexe ?
En règle générale, les scores z inférieurs à -1,96 ou supérieurs à 1,96 sont considérés comme inhabituels et intéressants, c’est-à-dire que d’un point de vue statistique, il s’agit de valeurs tout à fait atypiques.
Cet article explique comment calculer un score z dans Tableau.
Connectez-vous à la source de données Exemple - Hypermarché fournie avec Tableau Desktop.
Créez un champ calculé pour calculer des ventes moyennes.
Choisissez Analyse > Créer un champ calculé pour ouvrir l’éditeur de calcul. Nommez le calcul Average Sales, et entrez ou collez ce qui suit dans la zone de formule :
WINDOW_AVG(SUM([Sales]))
Créez un autre champ calculé pour calculer l’écart-type. Nommez le calcul STDEVP Sales, et entrez ou collez ce qui suit dans la zone de formule :
WINDOW_STDEVP(SUM([Sales]))
Créez un autre champ calculé, cette fois pour calculer le score z. Nommez le calcul Z-score, et entrez ou collez ce qui suit dans la zone de formule :
(SUM([Sales]) - [Average Sales]) / [STDEVP Sales]
Faites glisser Z-Score depuis le volet Données vers Colonnes et State vers Lignes.
Notez que le champ Z-score dans Colonnes contient une icône de calcul de table sur le côté droit (à savoir un petit triangle) :
La fonction STDEVP Sales est basée sur la fonction WINDOW_STDEVP, qui est une fonction de calcul de table. La fonction Z-Score, à son tour, est une fonction de calcul de table parce qu’elle inclut STDEVP Sales dans sa définition. Lorsque vous utilisez un champ calculé qui inclut une fonction de calcul de table dans une vue, cela revient au même que d’ajouter un calcul de table à un champ manuellement. Vous pouvez modifier le champ en tant que calcul de table. C’est d’ailleurs ce que vous allez faire ensuite.
Cliquez sur le champ Z-score dans Colonnes et choisissez Calculer à l’aide de > State.
Les scores z sont ainsi calculés sur la base de chaque État.
Cliquez sur l’icône Ordre décroissant dans la barre d’outils :
Maintenez la touche Ctrl enfoncée et faites glisser le champ Z-score de Colonnes vers Couleur.
Utilisez Ctrl + faire glisser pour copier un champ tel que configuré actuellement vers un emplacement supplémentaire.
Appuyez sur Ctrl + faites glisser sur Z-score depuis Colonnes une nouvelle fois. Cette fois, déposez sur Étiquette.
Vous avez maintenant une distribution de scores z répartis par État. Les États de Californie et de New York ont tous deux des scores supérieurs à 1,96. Vous pouvez en conclure que la Californie et New York enregistrent des ventes moyennes largement supérieures aux autres États.