計算 Z 分數
在統計中,某個觀察值的 z 得分(或標準得分)是一個高於或低於總體平均值的標準差數字。
為了計算 z 得分,您必須知道總體平均值和總體標準差。在無法測量總體的每個觀察值的情況下,您可以使用隨機樣本估計標準差。
建立一個 z 得分視覺效果來回答如下問題:
低於特定值的值占多少百分比?
什麼值可被視為異常?例如,在 IQ 測試中,什麼得分表示前 5%?
一個分佈與另一個分佈相比的相對得分是多少?例如,Michael 的身高要高於平均男性身高,Emily 的身高要高於平均女性身高,但在其自己的性別中,誰的身高相對較高?
一般情況下,低於 -1.96 或高於 1.96 的 z 得分被視為不尋常且很有趣。即,它們具有統計學意義並且是離群值。
本文示範如何在 Tableau 中計算 z 得分。
連線到 Tableau Desktop 附帶的[範例 - 超級市場]資料來源。
建立計算欄位以計算平均銷售額。
選取 [分析] > [建立計算欄位] 以開啟計算編輯器。將計算命名為 [Average Sales] (平均銷售額),並在公式區域中鍵入或貼上以下內容:
WINDOW_AVG(SUM([Sales]))
建立另一個計算欄位以計算標準差。將計算命名為 [STDEVP Sales] (STDEVP 銷售額),並在公式區域中鍵入或貼上以下內容:
WINDOW_STDEVP(SUM([Sales]))
再建立一個計算欄位,此計算欄位用於計算 z 得分。將計算命名為 [Z-score] (Z 得分),並在公式區域中鍵入或貼上以下內容:
(SUM([Sales]) - [Average Sales]) / [STDEVP Sales]
將 [Z-Score] (Z 得分)從 [資料] 窗格拖到 [欄] ,並將 [State] (市/縣)拖到 [列] 。
請注意, [欄] 上 [Z-score] (Z 得分)欄位的右側有一個表計算圖示(即一個小三角形):
[STDEVP Sales] (STDEVP 銷售額)函數基於 WINDOW_STDEVP 函數,即表計算函數。 [Z-Score] (Z 得分)函數反過來又是一個表計算函數,因為它在其定義中包括 [STDEVP Sales] (STDEVP 銷售額)。在檢視中使用包括表計算函數的計算欄位時,就相當於手動向欄位中新增表計算。可將欄位作為表計算進行編輯。事實上,這就是您接著要進行的操作。
在 [欄] 上按一下 [Z-score] (Z 得分)欄位,並選取 [計算依據] > [State] (市/縣)。
這將導致 z 得分按市/縣進行計算。
按一下工具列上的 [降冪排序] 圖示:
按住 Ctrl 鍵並將 [Z-score] (Z 得分)欄位從 [欄] 拖到 [色彩] 。
按住 Ctrl 手動可將欄位以當前設定方式複製到其他位置。
按住 Ctrl 並將 [Z-score] (Z 得分)從 [欄] 中再次拖出。這一次將其放在 [標籤] 上。
現在就有了一個按市/縣劃分的 z 得分分佈。加利福尼亞州和紐約州的 z 得分高於 1.96。您可以由此得出結論:加利福尼亞州和紐約州的平均銷售額明顯高於其他各州的平均銷售額。