Z スコアの計算

統計において、観測値の Z スコア (または標準スコア) とは、標準偏差の数が母平均より上または下である度合いのことです。

Z スコアを計算するには、母平均と母集団の標準偏差を知っている必要があります。母集団のすべての観測値を観測することが不可能な場合、無作為抽出を使用して標準偏差を推定できます。

次のような質問に回答するため、Z スコアの視覚化を作成します。

  • 特定の値により下である値の割合はどれほどか。

  • 例外と見なすことができる値は何か。たとえば、IQ テストにおいて上位 5% を表すスコアは何か、などです。

  • 別の分布に対するある分布の相対スコアは何か。たとえば、Michael が平均男性より背が高く、Emily が平均女性より背が高い場合に、同姓に対してどちらがより背が高いか、などです。

一般的な原則として、-1.96 未満か 1.96 を超える Z スコアは異常であり、興味を引きます。つまり、これは統計的に意味を持つ外れ値です。

この記事では、Tableau で Z スコアを計算する方法について説明します。

  1. Tableau Desktop に付属の "Sample - Superstore (サンプル - スーパーストア)" データ ソースに接続します。

  2. 平均売上高を求める計算フィールドを作成します。

    [分析] > [計算フィールドの作成] を選択して、計算エディターを開きます。計算に "Average Sales (平均売上高)" と名前を付け、式エリアに次を入力または貼り付けます。

    WINDOW_AVG(SUM([Sales]))

  3. 標準偏差を計算する別の計算フィールドを作成します。計算に "STDEVP Sales (STDEVP 売上高)" と名前を付け、式エリアに次を入力または貼り付けます。

    WINDOW_STDEVP(SUM([Sales]))

  4. 1 つ以上の計算フィールドを作成します。これは Z スコアを計算するものです。計算に "Z-score (Z スコア)" と名前を付け、式エリアに次を入力または貼り付けます。

    (SUM([Sales]) - [Average Sales]) / [STDEVP Sales]

  5. [データ] ペインから、"Z-score (Z スコア)"[列] に、"State (州)"[行] にドラッグします。

    [列] の "Z-score (Z スコア)" フィールドには、右側に表計算アイコン (小さい三角形) があることに注意してください。

    STDEVP Sales 関数は、表計算関数である WINDOW_STDEVP 関数に基づいています。結局のところ、"Z-Score (Z コア)" 関数は定義に STDEVP Sales が含まれるため、表計算です。ビューで表計算関数を含む計算フィールドを使用する場合は、表計算を手動でフィールドに追加するのと同じです。フィールドを表計算として編集できます。実際、次に行うのはまさにその操作です。

  6. [列] の [Z スコア] フィールドをクリックし、[次を使用して計算] > [州] を選択します。

    これにより、Z スコアが州ごとに計算されます。

  7. ツールバーの [降順に並べ替え] アイコンをクリックします。

  8. Ctrl キーを押しながら、[Z スコア] フィールドを [列] シェルフから [フィルター] シェルフにドラッグします。

    Ctrl を押しながらドラッグすることで、フィールドを現在構成されている場所から追加の場所へとコピーします。

  9. もう一度、Ctrl を押したまま [列] から [Z スコア] をドラッグします。今回は、[ラベル] にドラッグします。

これで、Z スコアの分布が州ごとに分割されました。"California (カリフォルニア)" と "New York (ニューヨーク)" は両方とも Z スコアが 1.96 より大きくなっています。このことから、カリフォルニアとニューヨークでの売上は他の州の平均売上より大幅に高いと結論できます。

ありがとうございます!