時系列ビジュアライゼーションにおける予測モデリング関数

このドキュメントでは、時間軸を将来に拡張するために必要な手順について説明します。予測モデリング関数を使用して、将来の日付に対する予測を行うことができます。

以下の例に沿ってその方法を確認します。

ステップ 1: ビジュアライゼーションを作成する

  1. Tableau Desktop で、Tableau に付属のサンプル - スーパーストア保存済みデータ ソースに接続します。

  2. ワークシート [シート 1] に移動します。

  3. [データ] ペインから、"Order Date (オーダー日)" ディメンションを [列] シェルフにドラッグします。

  4. メジャーのコンテキスト メニューを開き、リスト レベルを [月] と [年] に変更します。

    メジャーのコンテキスト メニュー

  5. [利益] を [行] シェルフにドラッグします。

ステップ 2: 予測計算を作成する

  1. 上部の [分析] メニューをクリックして開き、[計算フィールドの作成] を選択します。

  2. 計算エディターで、次の手順を実行します。

    • 計算に名前を付けます: 利益中央値の分位数予測

    • 次の式を入力します。

    • MODEL_QUANTILE(0.5, SUM([Profit]),ATTR(DATETRUNC('month', [Order Date])))

    MODEL_QUANTILE 関数は、指定した分位数で、入力した予測変数に基づいて値を予測します。この例では分位数 = 0.5 であり、中央値を予測します。利益を予測したいので、ターゲット式は SUM([Profit]) です。過去のパフォーマンスに基づいて予測を行いたいので、予測変数として日付を含める必要があります。

    : 予測モデリング関数では、集計された引数と集計されていない引数を混在させることはできません。ターゲット式は集計式でなければならないので、予測変数も集計されている必要があります。この例では、ATTR(DATETRUNC(‘month', [Order Date])) を使用しています。ATTR 関数の詳細については、「属性 (ATTR) 関数を使用する場合」を参照してください。
  3. 終了したら、[OK] をクリックします。

    予測計算が [データ] ペインに計算フィールドとして追加されます。

ステップ 3: ビューに予測計算を追加する

  1. 予測計算を SUM(Profit) の右側の [行] シェルフにドラッグします。

  2. メジャーを右クリック (Mac では Control を押しながらクリック) し、[二重軸] を選択します。

  3. 二重軸のグラフで 2 本の軸を揃えて同じ目盛りを使用するには、第 2 軸 (この例では利益中央値の分位数予測) を右クリック (Mac ではコントロールを押しながらクリック) して [軸の同期] を選択します。これにより、2 つの軸の目盛りが揃います。

    利益率と予測曲線の折れ線グラフ

ステップ 4: 日付範囲を拡張し、データの密度を高くする

最後のステップでは、現在の日付範囲を超えるマークを追加できるように、水平軸を将来の日付まで拡張します。

  1. これを行うには、MONTH (発注日付範囲) フィールドのコンテキスト メニューを開き、[日付範囲の拡張]を選択します。

  2. [日付範囲の拡張] ダイアログで、軸を 16 か月延長してみましょう。

    [日付範囲の拡張] ダイアログ

    Tableau は、水平軸を拡張してビューを自動的に更新したので、これらの将来の日付の予測が含まれるようになりました。

    日付軸が将来の日付に拡張された折れ線グラフ

    青い [Profit (利益)] の線がグラフの端まで伸びていません。一方、予測計算を表すオレンジ色の線は、グラフ [Quantile Predict Median Profit (利益の予測中央変位値)]グラフの端まで伸びています。将来の日付での予測利益の計算はデータの高密度化の 1 つの例です。Tableau が欠落した値を補完するためにビュー内に追加のマークを作成すると計算が行われます。基になるデータ ソースにデータは追加されません。マークが生成され、ビューに追加されるだけです。

注: 日付範囲を将来まで拡張すると、Tableau は [分析] メニューの [Infer Properties from Missing Values (欠落した値からプロパティを推測する)] オプションを自動的に有効にします。これにより、予測計算が行われ、欠落した値が補完されます。このメニュー オプションの詳細については、「生成されたマークを使用した予測モデリング」を参照してください。

データの高密度化についての詳細は、Data Plus Science(新しいウィンドウでリンクが開く)データ高密度化についての投稿(新しいウィンドウでリンクが開く)を参照してください。