计算 Z 分数
在统计中,某个观察值的 z 得分(或标准得分)是一个高于或低于总体平均值的标准差数字。
为了计算 z 得分,您必须知道总体平均值和总体标准差。在无法测量总体的每个观察值的情况下,您可以使用随机样本估计标准差。
创建一个 z 得分可视化项来回答如下问题:
低于特定值的值占多少百分比?
什么值可被视为异常?例如,在 IQ 测试中,什么得分表示前 5%?
一个分布与另一个分布相比的相对得分是多少?例如,Michael 的身高要高于平均男性身高,Emily 的身高要高于平均女性身高,但在其自己的性别中,谁的身高相对较高?
一般情况下,低于 -1.96 或高于 1.96 的 z 得分被视为不寻常且很有趣。也就是说,它们具有统计学意义并且是离群值。
本文演示如何在 Tableau 中计算 z 得分。
连接到 Tableau Desktop 附带的示例 - 超市数据源。
创建计算字段以计算平均销售额。
选择“分析”>“创建计算字段”以打开计算编辑器。将计算命名为“Average Sales”(平均销售额),并在公式区域中键入或粘贴以下内容:
WINDOW_AVG(SUM([Sales]))
创建另一个计算字段以计算标准差。将计算命名为“STDEVP Sales”(STDEVP 销售额),并在公式区域中键入或粘贴以下内容:
WINDOW_STDEVP(SUM([Sales]))
再创建一个计算字段,此计算字段用于计算 z 得分。将计算命名为“Z-score”(Z 得分),并在公式区域中键入或粘贴以下内容:
(SUM([Sales]) - [Average Sales]) / [STDEVP Sales]
将“Z-Score”(Z 得分)从“数据”窗格拖到“列”,并将“State”(州/省/市/自治区)拖到“行”。
请注意,“列”上“Z-score”(Z 得分)字段的右侧有一个表计算图标(即一个小三角形):
“STDEVP Sales”(STDEVP 销售额)函数基于 WINDOW_STDEVP 函数,即表计算函数。“Z-Score”(Z 得分)函数反过来又是一个表计算函数,因为它在其定义中包括“STDEVP Sales”(STDEVP 销售额)。在视图中使用包括表计算函数的计算字段时,就相当于手动向字段中添加表计算。可将字段作为表计算进行编辑。事实上,这就是您接着要进行的操作。
在“列”上单击“Z-score”(Z 得分)字段,并选择“计算依据”>“State”(州/省/市/自治区)。
这将导致 z 得分按州/省/市/自治区进行计算。
单击工具栏上的“降序排序”图标:
按住 Ctrl 键并将“Z-score”(Z 得分)字段从“列”拖到“颜色”。
按住 Ctrl 手动可将字段以当前配置方式复制到其他位置。
按住 Ctrl 并将“Z-score”(Z 得分)从“列”中再次拖出。这一次将其放在“标签”上。
现在就有了一个按州/省/市/自治区划分的 z 得分分布。加利福尼亚州和纽约州的 z 得分高于 1.96。您可以由此得出结论:加利福尼亚州和纽约州的平均销售额明显高于其他各州的平均销售额。