この記事は、集計関数と Tableau での用途について紹介します。また、例 を使用して集計計算を作成する方法を示しています。
集計関数を使う理由
集計関数を使用すると、データの集計、あるいは粒度の変更が可能です。
たとえば、特定の年にあなたの店舗で正確にいくつの注文があったかを知りたいとします。COUNTD 関数を使用して会社の正確な注文数を集計し、年ごとに視覚化することができます。
計算結果は次のようになります。
COUNTD(Order ID)
ビジュアライゼーションは次のようになります。
Tableau で利用可能な集計関数
集計と浮動小数点演算:一部の集計結果は、予測ほど正確ではない場合があります。たとえば、合計が正確に 0 になるはずの数値列で、Sum 関数が -1.42e-14 などの値を返すことがあります。これは、電気電子学会 (IEEE) 754 浮動小数点標準で、数値をバイナリ形式で保存することが求められていることに起因します。これは、電気電子学会 (IEEE) 754 浮動小数点標準で、数値をバイナリ形式で保存することが求められていることに起因します。つまり、数値は極めて高い精度で丸められる場合があります。ROUND 関数 (数値関数を参照) を使用することにより、または小数点以下の数桁をより少なくするように数値を書式設定することにより、このような障害の可能性を除外できます。
関数 | 構文 | 定義 |
ATTR |
| すべての行に単一の値がある場合に式の値を返します。それ以外の場合はアスタリスクを返します。NULL 値は無視されます。 |
AVG |
| 式内のすべての値の平均を返します。AVG に使用できるのは数値フィールドだけです。NULL 値は無視されます。 |
COLLECT |
| 引数フィールドの値を組み合わせる集計計算。NULL 値は無視されます。 注: COLLECT 関数は空間フィールドでのみ使用できます。 例:
|
CORR |
| 2 つの式のピアソン相関係数を返します。 ピアソン相関係数は、2 つの変数の間の線形関係を測定します。結果は -1 から +1 の範囲となります。ここで、1 つの変数のプラスの変化はもう一方の変数の対応する倍率のプラスの変化を示し、1 は正確なプラスの直線関係を示します。0 は分布間に線形の関係がないことを示し、−1 は正確なマイナスの関係を示します。 CORR は、次のデータ ソースで使用できます。
他のデータ ソースの場合、データの抽出または WINDOW_CORR の使用を検討してください。表計算関数を参照してください。 注:CORR 結果の 2 乗は、線形傾向線モデルの R-2 乗の値に相当します。傾向線モデルの項参照してください。 例: CORR を使用して非集計散布図で相関を可視化できます。これを実行する方法は、表範囲の詳細レベルの式として知られています。例:
詳細レベルの式では、相関はすべての行で実行します。 表範囲を参照してください。 |
COUNT |
| グループ内のアイテムの数を返します。Null 値は数に含まれません。 |
COUNTD |
| グループ内の個別のアイテムの数を返します。Null 値は数に含まれません。この関数は、Tableau Desktop 8.2 以前で作成され、Microsoft Excel やテキスト ファイルのデータ ソースを使用するワークブック、レガシー接続を使用するワークブック、および Microsoft Access データ ソースを使用するワークブックでは使用できません。この関数を使用するには、データを抽出ファイルに抽出します。データの抽出を参照してください。 |
COVAR |
| 2 つの式の標本共分散を返します。 共分散は 2 つの変数の変化をまとめて定量化します。ある変数の値が大きい場合は、平均して、他の変数の大きい値に対応している傾向があるため、プラスの共分散は変数が同じ方向に移動する傾向があることを示します。標本共分散では、母共分散によって (COVARP 関数で) 使用される n ではなく、non-null データ ポイントの数である n-1 を使用して共分散計算を標準化します。標本共分散は、データが大きな人口に対する共分散の見積もりに使用されるランダムなサンプルの場合に適しています。 COVAR は、次のデータ ソースで使用できます。
他のデータ ソースの場合、データの抽出または WINDOW_COVAR の使用を検討してください。表計算関数を参照してください。 expression1 と expression2 が同じ場合、たとえば、COVAR([profit], [profit]) の場合、COVAR は、値がどの程度の範囲で分散しているかを示す値を返します。 注:COVAR(X, X) の値は VAR(X) の値、および STDEV(X)^2 の値に相当します。 例: 次の計算式は、[売上高] および [収益] の標本共分散を返します。
|
COVARP |
| 2 つの式の母共分散を返します。 共分散は 2 つの変数の変化をまとめて定量化します。ある変数の値が大きい場合は、平均して、他の変数の大きい値に対応している傾向があるため、プラスの共分散は変数が同じ方向に移動する傾向があることを示します。母共分散は標本共分散に (n-1)/n を乗算したものです。ここで、n は non-null データ ポイントの合計です。母共分散は、対象のすべてのアイテムに対して利用可能なデータがある場合に最適です。反対に、アイテムのランダムなサブセットのみがある場合には、標本共分散 (COVAR 関数を使用) が適しています。 COVARP は、次のデータ ソースで使用できます。
他のデータ ソースの場合、データの抽出または WINDOW_COVARP の使用を検討してください。表計算関数を参照してください。 expression1 と expression2 が同じ場合、たとえば、COVARP([profit], [profit]) の場合、COVARP は、値がどの程度の範囲で分散しているかを示す値を返します。 注:COVARP(X, X) の値は VARP(X) の値、および STDEVP(X)^2 の値に相当します。 例: 次の計算式は、[売上高] および [収益] の母共分散を返します。
|
MAX |
| 式のすべてのレコードの中から最大値を返します。式が文字列値の場合は、アルファベット順で並べたときに最後になる値が返されます。 |
MEDIAN |
| 式のすべてのレコードの中から中央値を返します。中央値は数値フィールドでのみ使用できます。NULL 値は無視されます。この関数は、Tableau Desktop 8.2 より前のバージョンで作成されたワークブック、 または従来の接続を使用するワークブックでは使用できません。また、次のデータ ソースのいずれかを使用している接続では利用できません。
他のデータ ソース タイプの場合は、この関数を使用してデータを抽出ファイルに抽出できます。データの抽出を参照してください。 |
MIN |
| 式のすべてのレコードの中から最小値を返します。式が文字列値の場合は、アルファベット順で並べたときに最初になる値が返されます。 |
PERCENTILE |
| 指定された数字に対応する指定された式の百分位値を返します。数値は 0 と 1 (包含) の間である必要があります — たとえば、0.66 は数値定数にする必要があります。 この関数は、次のデータ ソースで使用できます。
他のデータ ソース タイプの場合は、この関数を使用してデータを抽出ファイルに抽出できます。データの抽出を参照してください。 |
STDEV |
| サンプル母集団に基づいて、指定された式のすべての値の統計的標準偏差を返します。 |
STDEVP |
| バイアス母集団に基づいて、指定された式のすべての値の統計的標準偏差を返します。 |
SUM |
| 式内のすべての値の合計を返します。SUM に使用できるのは数値フィールドだけです。NULL 値は無視されます。 |
VAR |
| サンプル母集団に基づいて、指定された式のすべての値の統計的変異を返します。 |
VARP |
| 母集団全体について、指定された式のすべての値の統計的変異を返します。 |
集計計算の作成
次の手順に従って、集計計算の作成方法を学習してください。
Tableau Desktop で、Tableau に付属の "Sample - Superstore (サンプル - スーパーストア)" 保存済みデータ ソースに接続します。
ワークシートに移動し、[分析]> [計算フィールドの作成]を選択します。
開いた計算エディターで、次の操作を実行します。
計算フィールドに "Margin" と名前を付けます。
次の式を入力します。
IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)
注: 関数参照を使って集計関数およびその他の関数 (例:この例の論理 IIF) を見つけて計算式に追加することができます。詳細は、計算エディターで関数参照を使用するを参照してください。
終了したら、[OK] をクリックします。
新しい集計計算は、[データ] ペインの [メジャー] に表示されます。他のフィールドと同様に、このフィールドを 1 つ以上のビジュアライゼーションで使用できます。
注: 集計計算は常にメジャーです。
Margin がワークシート内のシェルフまたはカードに配置されると、その名前は、集計計算でありそれ以上集計できないことを示す "AGG(Margin)" に変わります。
集計計算のルール
集計計算に適用される規則は次のとおりです。
集計計算では、集計後の値と集計前の値を組み合わせることはできません。たとえば、SUM(Price) は集計され Items は集計されないため、SUM(Price)*[Items] は有効な式ではありません。しかし、SUM(Price*Items) と SUM(Price)*SUM(Items) は両方とも有効です。
式の中の定数項は、場合に応じて集計値または非集計値として解釈されます。例: SUM(Price*7) と SUM(Price)*7 は両方とも有効な式です。
すべての関数を集計値に基づいて評価できます。ただし、どの関数の引数にも、集計値のみまたは非集計値のみを指定する必要があります。例: Sales は集計され、Profit は集計されないため、MAX(SUM(Sales),Profit) は有効な式ではありません。しかし、MAX(SUM(Sales),SUM(Profit)) は有効な式です。
集計計算の結果は、常にメジャーです。
事前定義済みの集計と同様に、集計計算でも総計が正しく計算されます。詳細については、「総計」を参照してください。
関連項目
計算を理解する: 集計計算(新しいウィンドウでリンクが開く)
Tableau でのデータ集計(新しいウィンドウでリンクが開く)