予測モデリング関数
この記事では、予測モデリング関数と Tableau でのこの関数の使用について説明します。また、予測モデリング関数を使用して表計算を作成する方法を例を通じて説明します。
予測モデリング関数を使用する理由
予測モデリング関数を使用すると、表計算を活用して、データのように操作、視覚化、エクスポートできる予測をすばやく生成できます。
以前は、高度な統計計算を実行して Tableau で視覚化するために、Tableau を R および Python と統合する必要がありました。変数を更新し、予測変数のさまざまな組み合わせを使用して複数のモデルを視覚化することで、ターゲットと予測変数を選択できるようになりました。データはすべての詳細レベルでフィルター処理、集計、および変換が可能であり、入力と予測は、ビュー内のデータと一致するように自動的に再計算されます。
Tableau の予測モデリング関数の詳細については、Tableau における予測モデリング関数の仕組みを参照してください。
Tableau で使用できる予測モデリング関数
MODEL_PERCENTILE
構文 | MODEL_PERCENTILE(
|
定義 | 予測値が観測されたマーク以下である確率 (0 から 1 の間) を返します。マークは、ターゲット式と他の予測変数で定義されます。これは、累積分布関数 (CDF) とも呼ばれる事後予測分布関数です。 |
例 | MODEL_PERCENTILE( SUM([Sales]),COUNT([Orders])) |
MODEL_QUANTILE
構文 | MODEL_QUANTILE(
|
定義 | 指定した分位数で、ターゲット式と他の予測変数によって定義された推定範囲内のターゲット数値を返します。これは事後予測分位です。 |
例 | MODEL_QUANTILE(0.5, SUM([Sales]), COUNT([Orders])) |
予測計算の作成
次の手順に従って、MODEL_QUANTILE 関数を使用した簡単な予測計算の作成方法について学習してください。より詳細な例については、例 - 予測モデリング関数を使用した女性の平均寿命の調査を参照してください。
ステップ 1: ビジュアライゼーションを作成する
- Tableau Desktop で、Tableau に付属のサンプル - スーパーストア保存済みデータ ソースに接続します。
- ワークシートに移動します。
- [データ] ペインから、"Order Date (オーダー日)" ディメンションを [列] シェルフにドラッグします。
- メジャーのコンテキスト メニューを開き、リスト レベルを [月] と [年] に変更します。
- [Sales (売上)] を [行] シェルフにドラッグします。
ステップ 2: 計算フィールドを作成する
- 上部の [分析] メニューをクリックして開き、[計算フィールドの作成] を選択します。
- 計算エディターで、次の手順を実行します。
- 計算に "Predict Median Sales (売上中央値の予測)" という名前を付けます。
- 次の式を入力します。
MODEL_QUANTILE(0.5, SUM([Sales]),ATTR(DATETRUNC('month', [Order Date])))
注意: MODEL_QUANTILE 関数は、指定された分位を取り、入力した予測変数に基づいて値を予測します。
この式を分析します。
- この例では分位数 = 0.5 であり、中央値を予測します。
- 売上を予測したいので、ターゲット式は SUM([Sales]) です。
- 過去の実績に基づいて予測を行うため、予測変数として日付を含めます。日付は計算の最後の引数です。
- 終了したら、[OK] をクリックします。
予測計算が [データ] ペインに計算フィールドとして追加されます。
ステップ 3: ビューに予測計算を追加する
- 予測計算を [行] シェルフにドラッグし、"SUM(Sales) (合計 (売上))" の右に配置します。
- メジャーを右クリック (Mac では Control を押しながらクリック) し、[二重軸] を選択します。
- 二重軸チャートの 2 本の軸を揃えて同じスケールを使用するようにするには、セカンダリ軸 (この場合は、"Predict Median Sales (売上中央値の予測)") を右クリック (Mac では Control を押しながらクリック) して [軸の同期] を選択します。これにより、2 つの軸の目盛りが揃います。
それ以外の処理は必要ありません。日付軸を拡張して将来を予測する方法については、時系列ビジュアライゼーションにおける予測モデリング関数を参照してください。
予測計算のルール
- 集計および非集計の引数を混在させることはできません。ターゲット式が集計の場合は、予測変数も集計である必要があります。
- これらの関数は、各マークが別個のエンティティ (個人、製品、売上など) を表している Viz で、個々のレコードの値を予測するのに最適です。
- これらの関数は、SUM と COUNT を使用してターゲット集計式の値を予測するのに最適です。
- これらの関数は、AVG、MEDIAN、MIN、または MAX を使用してターゲット集計式の値を予測することは推奨されません。
- これらの関数は、同じ詳細レベルまたは Viz よりも高い詳細レベルの予測変数を使用する必要があります。