予測の説明
[予測の説明] ダイアログ ボックスは、Tableau が視覚化用に計算した予測モデルについて説明します。
予測が有効になっていると、[分析] > [予測] > [予測の説明] の順に選択して、このダイアログを開きます。
[予測の説明] ダイアログ ボックスの情報は読み取り専用ですが、[クリップボードにコピー] をクリックして、画面の内容をドキュメントに貼り付けることができます。
[予測の説明] ダイアログ ボックスには、[サマリー] タブと [モデル] タブがあります。
[予測の説明] – [サマリー] タブ
[サマリー] タブは、Tableau が作成した予測モデルと、データに見られる一般的なパターンを説明します。
予測モデルの作成に使用されるオプション
このセクションには、Tableau が予測の作成に使用するオプションの要約が表示されます。これらのオプションは、Tableau によって自動的に選択されたか、[予測オプション] ダイアログ ボックスに指定したものです。
時系列—時系列を定義するために使用される連続日付フィールド。場合によっては、この値は実際には日付ではない可能性があります。ビューに日付がない場合の予測を参照してください。
メジャー—値を予想するメジャー。
次の予測—予測の長さと日付範囲。
次に基づく予測—予測の作成に使用される実際のデータの日付範囲。
最後を無視する—無視する実際のデータの最後の期間の数。この期間には予測データが表示されます。この値は、[予測オプション] ダイアログ ボックスの [最後を無視する] オプションによって決定されます。
季節性パターン—データに見られた季節的なサイクルの長さ。季節的なサイクルが予測に見られなかった場合は [なし]。
予測サマリー表
予測された各メジャーについて、予測を記述するサマリー表が表示されます。ビューがディメンションにより複数のペインに分かれている場合、各表にディメンションを識別する列が挿入されます。サマリー予測表には、次のフィールドがあります。
初期—最初の予測期間の値と予測間隔。
初期からの変更—最初と最後の予測推定ポイントの差異。2 つのポイントの間隔は列ヘッダーに表示されます。値がパーセンテージとして表されている場合、このフィールドには、最初の予測期間からの変更率が表示されます。
季節変動の影響—これらのフィールドは、季節変動、つまり長い期間にわたって繰り返される変動パターンがあることが特定されたモデルに表示されます。ここには、実績値と予測値を組み合わせた時系列において、最後の完全な季節的サイクルを構成する季節性要素の最大値と最小値が表示されます。季節性要素は、傾向からの逸脱を表すため、ゼロの前後で変化し、季節を通じて合計がゼロになります。
貢献度—傾向と季節性が予測にどの程度貢献しているかを表した値。これらの値は常にパーセンテージで表され、合計が 100% になります。
品質—予測が実際のデータにどれほど適合しているかを示します。正の値は GOOD、OK、および POOR です。ナイーブ予測は、次の期間の値が現在の期間の値と同等であると想定する予測として定義されます。品質はナイーブ予測に対して相対的に表され、OK は予測の方がナイーブ予測よりエラーが少なく、GOOD は予測のエラーがナイーブ予測のエラーの半分より少なく、POOR は予測の方がエラーが多いことを示します。
[予測の説明] – [モデル] タブ
[モデル] タブは、予測の基礎となる Holt-Winters 指数平滑法モデルのさらに詳しい統計とスムージング係数値を提供します。予測された各メジャーにつき、メジャーに対して Tableau で作成された予測モデルについて説明する表が表示されます。ビューがディメンションにより複数のペインに分かれている場合、各表にディメンションを識別する列が挿入されます。表は次のセクションで構成されています。
モデル
[レベル]、[傾向]、または [季節] の各要素が、予測の作成に使用されたモデルの一部であるかを指定します。各要素の値は、次のいずれかです。
なし—要素がモデルに存在しません。
加算—この要素が存在し、他の要素に追加されて全体の予測値になっているものと判断されました。
乗算—この要素が存在し、他の要素に乗算されて全体の予測値になっているものと判断されました。
品質メトリクス
この値セットはモデルの品質に関する統計情報を提供します。
値 | 定義 |
RMSE: 根平均二乗誤差 | |
MAE: 平均絶対誤差 | |
MASE: 平均絶対スケール誤差 MASE は、ナイーブ短期予測の誤差の大きさと比較して誤差の大きさを比率で測定します。ナイーブ予測は、今日の値が明日も同じであると仮定します。そのため、MASE 0.5 は、予測の誤差はナイーブ予測の誤差の半分の可能性があるという意味です。これは、MASE 1.0 より良いということであり、ナイーブ予測に等しいということです。これは、すべての値のために定義される正規化統計であり、誤差に均等に重みをつけるため、異なる予測方法の品質と比較するための優れた指標です。 一般的な MAPE 指標に比べて MASE 測定基準の利点は、MASE 基準はゼロを含む時系列に定義されますが、MAPE はそうではありません。また、MASE はエラーに同等の重みを付けますが、MAPE はポジティブ/極端なエラーをより重視します。 | |
MAPE: 平均絶対パーセント誤差 MAPE は、データの大きさと比較して誤差の大きさを割合として測定します。したがって、MAPE 20 % は、MAPE 60 % より良いということです。誤差は、モデルが推定する反応値と、データ内の各説明値の実際の反応値の間の差です。これは正規化統計であるため、Tableau で計算される異なるモデルの品質を比較するために使用されます。しかし、誤差の種類によっては他の誤差より重みを付けるため、比較によっては信憑性に欠けます。また、値がゼロのデータは定義されません。 | |
AIC: 赤池の情報量基準。 赤池弘次により開発された AIC は、モデル品質の指標で、複雑なモデルを制限し、過適合するのを防ぎます。この定義では、k は初期状態を含む推定パラメーター数で、SSE は二乗誤差の合計です。 |
前述の定義では、変数は以下のとおりです。
変数 | 意味 |
t | 時系列における期間のインデックス。 |
n | 時系列の長さ。 |
m | 季節/周期における期間の数。 |
A(t) | 期間 t 時点でのタイム シリーズの実際の値。 |
F(t) | 期間 t 時点での近似値または予測値。 |
残差: e(t) = F(t)-A(t)
スムージング係数
データのレベル、傾向、季節的な要素の変化率に応じて、古いデータ値より新しいデータ値に重みが付いてスムージング係数が最適化され、サンプル内短期予測誤差を最小限に抑えます。アルファはレベル スムージング係数、ベータは傾向スムージング係数、ガンマは季節性スムージング係数です。スムージング係数が 1.00 に近いほど、実行されるスムージングは少なくなり、迅速にコンポーネントを変更し、最近のデータへの依存度を高くすることができます。スムージング係数が 0.00 に近いほど、実行されるスムージングは多くなり、徐々にコンポーネントを変更し、最近のデータへの依存度を低くすることができます。