この記事は、集計関数と Tableau での用途について紹介します。また、例 を使用して集計計算を作成する方法を示しています。

集計関数を使う理由

集計関数を使用すると、データの集計、あるいは粒度の変更が可能です。

たとえば、特定の年にあなたの店舗で正確にいくつの注文があったかを知りたいとします。COUNTD 関数を使用して会社の正確な注文数を集計し、年ごとに視覚化することができます。

計算結果は次のようになります。

COUNTD(Order ID)

ビジュアライゼーションは次のようになります。

Tableau で利用可能な集計関数

集計と浮動小数点演算:一部の集計結果は、予測ほど正確ではない場合があります。たとえば、合計が正確に 0 になるはずの数値列で、Sum 関数が -1.42e-14 などの値を返すことがあります。これは、電気電子学会 (IEEE) 754 浮動小数点標準で、数値をバイナリ形式で保存することが求められていることに起因します。これは、電気電子学会 (IEEE) 754 浮動小数点標準で、数値をバイナリ形式で保存することが求められていることに起因します。つまり、数値は極めて高い精度で丸められる場合があります。ROUND 関数 (数値関数を参照) を使用することにより、または小数点以下の数桁をより少なくするように数値を書式設定することにより、このような障害の可能性を除外できます。

関数

構文

定義

ATTR

ATTR(expression)

すべての行に単一の値がある場合に式の値を返します。それ以外の場合はアスタリスクを返します。NULL 値は無視されます。

AVG

AVG(expression)

式内のすべての値の平均を返します。AVG に使用できるのは数値フィールドだけです。NULL 値は無視されます。

COLLECT

COLLECT (spatial)

引数フィールドの値を組み合わせる集計計算。NULL 値は無視されます。

: COLLECT 関数は空間フィールドでのみ使用できます。

例:

COLLECT ([Geometry])

CORR

CORR(expression 1, expression2)

2 つの式のピアソン相関係数を返します。

ピアソン相関係数は、2 つの変数の間の線形関係を測定します。結果は -1 から +1 の範囲となります。ここで、1 つの変数のプラスの変化はもう一方の変数の対応する倍率のプラスの変化を示し、1 は正確なプラスの直線関係を示します。0 は分布間に線形の関係がないことを示し、−1 は正確なマイナスの関係を示します。

CORR は、次のデータ ソースで使用できます。

  • Tableau データ抽出 (任意のデータ ソースから抽出を作成できます)
  • Cloudera Hive
  • EXASolution
  • Firebird (バージョン 3.0 以降)
  • Google BigQuery
  • Hortonworks Hadoop Hive
  • IBM PDA (Netezza)
  • Oracle
  • PostgreSQL
  • Presto
  • SybaseIQ
  • Teradata
  • Vertica

他のデータ ソースの場合、データの抽出または WINDOW_CORR の使用を検討してください。表計算関数を参照してください。

:CORR 結果の 2 乗は、線形傾向線モデルの R-2 乗の値に相当します。傾向線モデルの項参照してください。

例:

CORR を使用して非集計散布図で相関を可視化できます。これを実行する方法は、表範囲の詳細レベルの式として知られています。例:

{CORR(Sales, Profit)}

詳細レベルの式では、相関はすべての行で実行します。CORR(Sales, Profit) (詳細レベルの式にするには括弧を使用しない) のような式を使用した場合、ビューはそれぞれ未定義の他のデータ ポイントを使用した散布図における、各個別ポイントの相関を示します。

表範囲を参照してください。

COUNT

COUNT(expression)

グループ内のアイテムの数を返します。Null 値は数に含まれません。

COUNTD

COUNTD(expression)

グループ内の個別のアイテムの数を返します。Null 値は数に含まれません。この関数は、Tableau Desktop 8.2 以前で作成され、Microsoft Excel やテキスト ファイルのデータ ソースを使用するワークブック、レガシー接続を使用するワークブック、および Microsoft Access データ ソースを使用するワークブックでは使用できません。この関数を使用するには、データを抽出ファイルに抽出します。データの抽出を参照してください。

COVAR

COVAR(expression 1, expression2)

2 つの式の標本共分散を返します。

共分散は 2 つの変数の変化をまとめて定量化します。ある変数の値が大きい場合は、平均して、他の変数の大きい値に対応している傾向があるため、プラスの共分散は変数が同じ方向に移動する傾向があることを示します。標本共分散では、母共分散によって (COVARP 関数で) 使用される n ではなく、non-null データ ポイントの数である n-1 を使用して共分散計算を標準化します。標本共分散は、データが大きな人口に対する共分散の見積もりに使用されるランダムなサンプルの場合に適しています。

COVAR は、次のデータ ソースで使用できます。

  • Tableau データ抽出 (任意のデータ ソースから抽出を作成できます)
  • Cloudera Hive
  • EXASolution
  • Firebird (バージョン 3.0 以降)
  • Google BigQuery
  • Hortonworks Hadoop Hive
  • IBM PDA (Netezza)
  • Oracle
  • PostgreSQL
  • Presto
  • SybaseIQ
  • Teradata
  • Vertica

他のデータ ソースの場合、データの抽出または WINDOW_COVAR の使用を検討してください。表計算関数を参照してください。

expression1 と expression2 が同じ場合、たとえば、COVAR([profit], [profit]) の場合、COVAR は、値がどの程度の範囲で分散しているかを示す値を返します。

:COVAR(X, X) の値は VAR(X) の値、および STDEV(X)^2 の値に相当します。

例:

次の計算式は、[売上高] および [収益] の標本共分散を返します。

COVAR([Sales], [Profit])

COVARP

COVARP(expression 1, expression2)

2 つの式の母共分散を返します。

共分散は 2 つの変数の変化をまとめて定量化します。ある変数の値が大きい場合は、平均して、他の変数の大きい値に対応している傾向があるため、プラスの共分散は変数が同じ方向に移動する傾向があることを示します。母共分散は標本共分散に (n-1)/n を乗算したものです。ここで、n は non-null データ ポイントの合計です。母共分散は、対象のすべてのアイテムに対して利用可能なデータがある場合に最適です。反対に、アイテムのランダムなサブセットのみがある場合には、標本共分散 (COVAR 関数を使用) が適しています。

COVARP は、次のデータ ソースで使用できます。

  • Tableau データ抽出 (任意のデータ ソースから抽出を作成できます)
  • Cloudera Hive
  • EXASolution
  • Firebird (バージョン 3.0 以降)
  • Google BigQuery
  • Hortonworks Hadoop Hive
  • IBM PDA (Netezza)
  • Oracle
  • PostgreSQL
  • Presto
  • SybaseIQ
  • Teradata
  • Vertica

他のデータ ソースの場合、データの抽出または WINDOW_COVARP の使用を検討してください。表計算関数を参照してください。

expression1 と expression2 が同じ場合、たとえば、COVARP([profit], [profit]) の場合、COVARP は、値がどの程度の範囲で分散しているかを示す値を返します。

:COVARP(X, X) の値は VARP(X) の値、および STDEVP(X)^2 の値に相当します。

例:

次の計算式は、[売上高] および [収益] の母共分散を返します。

COVARP([Sales], [Profit])

MAX

MAX(expression)

式のすべてのレコードの中から最大値を返します。式が文字列値の場合は、アルファベット順で並べたときに最後になる値が返されます。

MEDIAN

MEDIAN(expression)

式のすべてのレコードの中から中央値を返します。中央値は数値フィールドでのみ使用できます。NULL 値は無視されます。この関数は、Tableau Desktop 8.2 より前のバージョンで作成されたワークブック、 または従来の接続を使用するワークブックでは使用できません。また、次のデータ ソースのいずれかを使用している接続では利用できません。

  • Access
  • Amazon Redshift
  • Cloudera Hadoop
  • HP Vertica
  • IBM DB2
  • IBM PDA (Netezza)
  • Microsoft SQL Server
  • MySQL
  • SAP HANA
  • Teradata

他のデータ ソース タイプの場合は、この関数を使用してデータを抽出ファイルに抽出できます。データの抽出を参照してください。

MIN

MIN(expression)

式のすべてのレコードの中から最小値を返します。式が文字列値の場合は、アルファベット順で並べたときに最初になる値が返されます。

PERCENTILE

PERCENTILE(expression, number)

指定された数字に対応する指定された式の百分位値を返します。数値は 0 と 1 (包含) の間である必要があります — たとえば、0.66 は数値定数にする必要があります。

この関数は、次のデータ ソースで使用できます。

  • Microsoft Excel およびテキスト ファイルの非レガシー接続。

  • 抽出および抽出のみのデータ ソースの種類 (たとえば、Google Analytics、OData、または Salesforce)。

  • Sybase IQ 15.1 以降のデータ ソース。

  • Oracle 10 以降のデータ ソース。

  • Cloudera Hive および Hortonworks Hadoop Hive データ ソース。

  • EXASolution 4.2 以降のデータ ソース。

他のデータ ソース タイプの場合は、この関数を使用してデータを抽出ファイルに抽出できます。データの抽出を参照してください。

STDEV

STDEV(expression)

サンプル母集団に基づいて、指定された式のすべての値の統計的標準偏差を返します。

STDEVP

STDEVP(expression)

バイアス母集団に基づいて、指定された式のすべての値の統計的標準偏差を返します。

SUM

SUM(expression)

式内のすべての値の合計を返します。SUM に使用できるのは数値フィールドだけです。NULL 値は無視されます。

VAR

VAR(expression)

サンプル母集団に基づいて、指定された式のすべての値の統計的変異を返します。

VARP

VARP(expression)

母集団全体について、指定された式のすべての値の統計的変異を返します。


集計計算の作成

次の手順に従って、集計計算の作成方法を学習してください。

  1. Tableau Desktop で、Tableau に付属の "Sample - Superstore (サンプル - スーパーストア)" 保存済みデータ ソースに接続します。

  2. ワークシートに移動し、[分析]> [計算フィールドの作成]を選択します。

  3. 開いた計算エディターで、次の操作を実行します。

    • 計算フィールドに "Margin" と名前を付けます。

    • 次の式を入力します。

      IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)

      : 関数参照を使って集計関数およびその他の関数 (例:この例の論理 IIF) を見つけて計算式に追加することができます。詳細は、計算エディターで関数参照を使用するを参照してください。

    • 完了後、[OK] をクリックします。

    新しい集計計算は、[データ] ペインの [メジャー] に表示されます。他のフィールドと同様に、このフィールドを 1 つ以上のビジュアライゼーションで使用できます。

    : 集計計算は常にメジャーです。

    Margin がワークシート内のシェルフまたはカードに配置されると、その名前は、集計計算でありそれ以上集計できないことを示す "AGG(Margin)" に変わります。

    集計計算をシェルフに配置するとどうなるかを示す図。このフィールドには、AGG プレフィックスが表示されます。

集計計算のルール

集計計算に適用される規則は次のとおりです。

  • 集計計算では、集計後の値と集計前の値を組み合わせることはできません。たとえば、SUM(Price) は集計され Items は集計されないため、SUM(Price)*[Items] は有効な式ではありません。しかし、SUM(Price*Items) と SUM(Price)*SUM(Items) は両方とも有効です。

  • 式の中の定数項は、場合に応じて集計値または非集計値として解釈されます。例: SUM(Price*7) と SUM(Price)*7 は両方とも有効な式です。

  • すべての関数を集計値に基づいて評価できます。ただし、どの関数の引数にも、集計値のみまたは非集計値のみを指定する必要があります。例: Sales は集計され、Profit は集計されないため、MAX(SUM(Sales),Profit) は有効な式ではありません。しかし、MAX(SUM(Sales),SUM(Profit)) は有効な式です。

  • 集計計算の結果は、常にメジャーです。

  • 事前定義済みの集計と同様に、集計計算でも総計が正しく計算されます。詳細については、「総計」を参照してください。

関連項目

計算を理解する: 集計計算(新しいウィンドウでリンクが開く)

Tableau でのデータ集計(新しいウィンドウでリンクが開く)

Tableau で使用する関数

Tableau 関数 (カテゴリ別)(新しいウィンドウでリンクが開く)

Tableau 関数 (アルファベット順)

ありがとうございます!