Z-scores berekenen
In de statistiek is de z-score (of standaardscore) van een waarneming het aantal standaardafwijkingen dat deze boven of onder het populatiegemiddelde ligt.
Als u een z-score wilt berekenen, moet u het populatiegemiddelde en de standaardafwijking van de populatie kennen. In gevallen waarin het onmogelijk is om elke waarneming van een populatie te meten, kunt u de standaardafwijking schatten met behulp van een willekeurige steekproef.
Maak een visualisatie voor z-scores om vragen als de volgende te beantwoorden:
Welk percentage van de waarden ligt onder een specifieke waarde?
Welke waarden kunnen als uitzonderlijk worden beschouwd? Welke scores behoren tot de top vijf procent, bijvoorbeeld in een IQ-test?
Wat is de relatieve score van de ene verdeling ten opzichte van de andere? Michael is bijvoorbeeld langer dan de gemiddelde man en Emily is langer dan de gemiddelde vrouw, maar wie is er relatief langer met betrekking tot hun geslacht?
Als algemene regel worden z-scores lager dan -1,96 of hoger dan 1,96 als ongebruikelijk en interessant beschouwd. Dat wil zeggen dat het statistisch gezien significante uitschieters zijn.
In dit artikel ziet u hoe u een z-score berekent in Tableau.
Maak verbinding met de databron Sample - Superstore die wordt geleverd bij Tableau Desktop.
Maak een berekend veld om de gemiddelde verkopen te berekenen.
Kies Analyse > Berekend veld maken om de berekeningseditor te openen. Geef de berekening de naam Gemiddelde verkopen en typ of plak het volgende in het formulegebied:
WINDOW_AVG(SUM([Sales]))
Maak nog een berekend veld om de standaardafwijking te berekenen. Geef de berekening de naam STDEVP-verkopen en typ of plak het volgende in het formulegebied:
WINDOW_STDEVP(SUM([Sales]))
Maak nog een berekend veld. Hiermee wordt de z-score berekend. Geef de berekening de naam Z-score en typ of plak het volgende in het formulegebied:
(SUM([Sales]) - [Average Sales]) / [STDEVP Sales]
Sleep Z-score vanuit het deelvenster Data naar Kolommen en Staat naar Rijen.
Merk op dat er in het veld Z-score in Kolommen rechts een tabelberekeningspictogram (een kleine driehoek) staat:
De functie STDEVP Sales is gebaseerd op de functie WINDOW_STDEVP, die een tabelberekeningsfunctie is. De functie Z-score is op zijn beurt een tabelberekeningsfunctie, omdat de definitie hiervan STDEVP Sales bevat. Wanneer u een berekend veld met een tabelberekeningsfunctie gebruikt in een weergave, is dat hetzelfde als het handmatig toevoegen van een tabelberekening aan een veld. U kunt het veld bewerken als een tabelberekening. Dat gaat u trouwens nu doen.
Klik op het veld Z-score in Kolommen en kies Berekenen met > Staat.
Op die manier worden de z-scores per staat berekend.
Klik op de werkbalk op het pictogram Aflopend sorteren:
Houd de Ctrl-toets ingedrukt en sleep het veld Z-score vanuit Kolommen naar Kleur.
Met Ctrl + slepen kopieert u een veld in de huidige configuratie naar een aanvullende locatie.
Houd de Ctrl-toets ingedrukt en sleep Z-score nogmaals uit Kolommen. Zet het deze keer op Label.
U beschikt nu over een verdeling van z-scores, uitgesplitst per staat. Californië en New York hebben beide een z-score die hoger is dan 1,96. U zou hieruit kunnen concluderen dat Californië en New York een aanzienlijk hogere gemiddelde verkopen hebben dan andere staten.