Tableau 内の集計関数
この記事は、集計関数と Tableau での用途について紹介します。また、例 を使用して集計計算を作成する方法を示しています。
集計関数を使う理由
集計関数を使用すると、データの集計、あるいは粒度の変更が可能です。
たとえば、特定の年にあなたの店舗で正確にいくつの注文があったかを知りたいとします。COUNTD 関数を使用して会社の正確な一意の注文数を集計し、年ごとに視覚化することができます。
計算結果は次のようになります。
COUNTD(Order ID)
ビジュアライゼーションは次のようになります。
Tableau で利用可能な集計関数
集計と浮動小数点演算: 集計結果のいくつかは、必ずしも期待通りになるとは限りません。たとえば、合計が正確に 0 になるはずの数値列で、SUM 関数が -1.42e-14 などの値を返すことがあります。これは、電気電子学会 (IEEE) 754 浮動小数点標準で、数値をバイナリ形式で保存することが求められていることに起因します。つまり、数値は極めて高い精度で丸められる場合があります。ROUND 関数 (数値関数を参照) を使用することにより、または小数点以下の数桁をより少なくするように数値を書式設定することにより、このような混乱が起こることを回避できます。
ATTR
構文 | ATTR(expression) |
定義 | すべての行に単一の値がある場合に式の値を返します。それ以外の場合はアスタリスクを返します。NULL 値は無視されます。 |
AVG
構文 | AVG(expression) |
定義 | 式内のすべての値の平均を返します。NULL 値は無視されます。 |
注 | AVG は数値フィールドでのみ使用できます。 |
COLLECT
構文 | COLLECT(spatial) |
定義 | 引数フィールドの値を組み合わせる集計計算。NULL 値は無視されます。 |
注 | COLLECT は空間フィールドでのみ使用できます。 |
CORR
構文 | CORR(expression1, expression2) |
出力 | -1 から 1 までの数値 |
定義 | 2 つの式のピアソン相関係数を返します。 |
例 | example |
注 | ピアソン相関係数は、2 つの変数の間の線形関係を測定します。結果は -1 から +1 の範囲となります。ここで、1 は完全な正の線形関係を示し、0 は変数間に線形関係がないことを示し、−1 は完全な負の線形関係を示します。 CORR 結果の 2 乗は、線形傾向線モデルの R-2 乗の値に相当します。「傾向線モデルの用語」(新しいウィンドウでリンクが開く)を参照してください。 テーブル スコープの LOD 式での使用 CORR を使用すると、テーブル スコープの詳細レベルの式(新しいウィンドウでリンクが開く)を使用して、集計していない散布図で相関関係を視覚化できます。例: {CORR(Sales, Profit)} 詳細レベルの式では、相関はすべての行で実行します。 |
データベースの制限 |
他のデータ ソースについては、データを抽出するか |
COUNT
構文 | COUNT(expression) |
定義 | アイテムの数を返します。Null 値は数に含まれません。 |
COUNTD
構文 | COUNTD(expression) |
定義 | グループ内の一意のアイテム数を返します。Null 値は数に含まれません。 |
COVAR
構文 | COVAR(expression1, expression2) |
定義 | 2 つの式の標本共分散を返します。 |
注 | 共分散は 2 つの変数の変化をまとめて定量化します。ある変数の値が大きい場合は、平均して、他の変数の大きい値に対応している傾向があるため、プラスの共分散は変数が同じ方向に移動する傾向があることを示します。標本共分散では、母共分散で (
|
データベースの制限 |
他のデータ ソースについては、データを抽出するか |
COVARP
構文 | COVARP(expression 1, expression2) |
定義 | 2 つの式の母共分散を返します。 |
注 | 共分散は 2 つの変数の変化をまとめて定量化します。ある変数の値が大きい場合は、平均して、他の変数の大きい値に対応している傾向があるため、プラスの共分散は変数が同じ方向に移動する傾向があることを示します。母共分散は標本共分散に (n-1)/n を乗算したものです。ここで、n は Null でないデータ ポイントの合計です。母共分散は、対象のすべてのアイテムに対して利用可能なデータがある場合に最適です。反対に、アイテムのランダムなサブセットのみがある場合には、標本共分散 (
|
データベースの制限 |
他のデータ ソースについては、データを抽出するか |
MAX
構文 | MAX(expression) または MAX(expr1, expr2) |
出力 | 引数と同じデータ型、または引数の一部が Null の場合 NULL 。 |
定義 | 2 つの引数の最大値を返します (2 つの引数は同じ型でなければなりません)。
|
例 | MAX(4,7) = 7 |
注 | 文字列の場合
データベースのデータ ソースでは、 日付の場合 日付の場合、 集計として
比較として
|
MEDIAN
構文 | MEDIAN(expression) |
定義 | 式のすべてのレコードの中から中央値を返します。Null 値は無視されます。 |
注 | MEDIAN は数値フィールドでのみ使用できます。 |
データベースの制限 |
他のデータ ソース タイプの場合は、この関数を使用してデータを抽出ファイルに抽出できます。「データの抽出」(新しいウィンドウでリンクが開く)を参照してください。 |
MIN
構文 | MIN(expression) または MIN(expr1, expr2) |
出力 | 引数と同じデータ型、または引数の一部が Null の場合 NULL 。 |
定義 | 2 つの引数の最小値を返します (2 つの引数は同じ型でなければなりません)。
|
例 | MIN(4,7) = 4 |
注 | 文字列の場合
データベースのデータ ソースでは、 日付の場合 日付の場合、 集計として
比較として
|
PERCENTILE
構文 | PERCENTILE(expression, number) |
定義 | 指定された <number> に対する指定された式の百分位値を返します。<number> は 0 と 1 の間 (0 と 1 を包む) の数値定数である必要があります。 |
例 | PERCENTILE([Score], 0.9) |
データベースの制限 | この関数は次のデータ ソースで使用できます。非レガシー Microsoft Excel およびテキスト ファイル接続、抽出および抽出専用のデータ ソース タイプ (Google Analytics、OData、または Salesforce など)、Sybase IQ 15.1 以降のデータ ソース、Oracle 10 以降のデータ ソース、Cloudera Hive および Hortonworks Hadoop Hive データ ソース、EXASolution 4.2 以降のデータ ソース。 他のデータ ソース タイプの場合は、この関数を使用してデータを抽出ファイルに抽出できます。「データの抽出」(新しいウィンドウでリンクが開く)を参照してください。 |
STDEV
構文 | STDEV(expression) |
定義 | サンプル母集団に基づいて、指定された式のすべての値の統計的標準偏差を返します。 |
STDEVP
構文 | STDEVP(expression) |
定義 | バイアス母集団に基づいて、指定された式のすべての値の統計的標準偏差を返します。 |
SUM
構文 | SUM(expression) |
定義 | 式内のすべての値の合計を返します。NULL 値は無視されます。 |
注 | SUM は数値フィールドでのみ使用できます。 |
VAR
構文 | VAR(expression) |
定義 | 母集団の標本に基づいて、指定された式のすべての値の統計的分散を返します。 |
VARP
構文 | VARP(expression) |
定義 | 母集団全体について、指定された式のすべての値の統計的変異を返します。 |
集計計算の作成
次の手順に従って、集計計算の作成方法を学習してください。
- Tableau Desktop で、Tableau に付属のサンプル - スーパーストア保存済みデータ ソースに接続します。
- ワークシートに移動し、[分析]> [計算フィールドの作成]を選択します。
- 開いた計算エディターで、次の操作を実行します。
- 計算フィールドに "Margin" と名前を付けます。
- 次の式を入力します。
IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)
注: 関数参照を使って集計関数およびその他の関数 (例:この例の論理 IIF) を見つけて計算式に追加することができます。詳細は、計算エディターで関数参照を使用するを参照してください。
- 終了したら、[OK] をクリックします。
新しい集計計算は、[データ] ペインの [メジャー] に表示されます。他のフィールドと同様に、このフィールドを 1 つ以上のビジュアライゼーションで使用できます。
注: 集計計算は常にメジャーです。
Margin がワークシート内のシェルフまたはカードに配置されると、その名前は、集計計算でありそれ以上集計できないことを示す "AGG(Margin)" に変わります。
集計計算のルール
集計計算に適用される規則は次のとおりです。
- 集計計算では、集計後の値と集計前の値を組み合わせることはできません。例:
SUM(Price)*[Items]
は有効な式ではありません。なぜなら、SUM(Price) は集計されますが、Items は集計されないからです。ただし、SUM(Price*Items)
とSUM(Price)*SUM(Items)
は両方とも有効です。 - 式の中の定数項は、場合に応じて集計値または非集計値として解釈されます。例:
SUM(Price*7)
とSUM(Price)*7
は両方とも有効な式です。 - すべての関数を集計値に基づいて評価できます。ただし、どの関数の引数にも、集計値のみまたは非集計値のみを指定する必要があります。例:
MAX(SUM(Sales),Profit)
は有効な式ではありません。なぜなら、Sales (売上) は集計されますが、Profit (収益) は集計されないからです。ただし、「MAX(SUM(Sales),SUM(Profit))
」は有効な式です。 - 集計計算の結果は、常にメジャーです。これには、ATTR(Dimension) や MIN(Dimension) などの式が含まれます。
- 事前定義済みの集計と同様に、集計計算でも総計が正しく計算されます。詳細については、「総計」を参照してください。
関連項目
計算を理解する: 集計計算(新しいウィンドウでリンクが開く)
Tableau でのデータ集計(新しいウィンドウでリンクが開く)