Z スコアの計算
統計において、観測値の Z スコア (または標準スコア) とは、標準偏差の数が母平均より上または下である度合いのことです。
Z スコアを計算するには、母平均と母集団の標準偏差を知っている必要があります。母集団のすべての観測値を観測することが不可能な場合、無作為抽出を使用して標準偏差を推定できます。
次のような質問に回答するため、Z スコアの視覚化を作成します。
特定の値により下である値の割合はどれほどか。
例外と見なすことができる値は何か。たとえば、IQ テストにおいて上位 5% を表すスコアは何か、などです。
別の分布に対するある分布の相対スコアは何か。たとえば、Michael が平均男性より背が高く、Emily が平均女性より背が高い場合に、同姓に対してどちらがより背が高いか、などです。
一般的な原則として、-1.96 未満か 1.96 を超える Z スコアは異常であり、興味を引きます。つまり、これは統計的に意味を持つ外れ値です。
この記事では、Tableau で Z スコアを計算する方法について説明します。
Tableau Desktop に付属のサンプル - スーパーストアデータ ソースに接続します。
平均売上高を求める計算フィールドを作成します。
[分析] > [計算フィールドの作成] を選択して、計算エディターを開きます。計算に "Average Sales (平均売上高)" と名前を付け、式エリアに次を入力または貼り付けます。
WINDOW_AVG(SUM([Sales]))
標準偏差を計算する別の計算フィールドを作成します。計算に "STDEVP Sales (STDEVP 売上高)" と名前を付け、式エリアに次を入力または貼り付けます。
WINDOW_STDEVP(SUM([Sales]))
1 つ以上の計算フィールドを作成します。これは Z スコアを計算するものです。計算に "Z-score (Z スコア)" と名前を付け、式エリアに次を入力または貼り付けます。
(SUM([Sales]) - [Average Sales]) / [STDEVP Sales]
[データ] ペインから、"Z-score (Z スコア)" を [列] に、"State (州)" を [行] にドラッグします。
[列] の "Z-score (Z スコア)" フィールドには、右側に表計算アイコン (小さい三角形) があることに注意してください。
STDEVP Sales 関数は、表計算関数である WINDOW_STDEVP 関数に基づいています。結局のところ、"Z-Score (Z コア)" 関数は定義に STDEVP Sales が含まれるため、表計算です。ビューで表計算関数を含む計算フィールドを使用する場合は、表計算を手動でフィールドに追加するのと同じです。フィールドを表計算として編集できます。実際、次に行うのはまさにその操作です。
[列] の [Z スコア] フィールドをクリックし、[次を使用して計算] > [州] を選択します。
これにより、Z スコアが州ごとに計算されます。
ツールバーの [降順に並べ替え] アイコンをクリックします。
Ctrl キーを押しながら、[Z スコア] フィールドを [列] シェルフから [フィルター] シェルフにドラッグします。
Ctrl を押しながらドラッグすることで、フィールドを現在構成されている場所から追加の場所へとコピーします。
もう一度、Ctrl を押したまま [列] から [Z スコア] をドラッグします。今回は、[ラベル] にドラッグします。
これで、Z スコアの分布が州ごとに分割されました。"California (カリフォルニア)" と "New York (ニューヨーク)" は両方とも Z スコアが 1.96 より大きくなっています。このことから、カリフォルニアとニューヨークでの売上は他の州の平均売上より大幅に高いと結論できます。