預測描述

[描述預測] 對話方塊描述了 Tableau 為您的視覺化項計算的預測模型。

啟用了預測後,您可透過選取 [分析] > [預測] > [描述預測] 開啟此對話方塊。

[描述預測] 對話方塊中的資訊是唯讀的,不過,您可以按一下 [複製到剪貼簿] ,然後將螢幕內容貼上到文件中。

[描述預測] 對話方塊有兩個索引標籤: [摘要] 索引標籤和 [模型] 索引標籤。

描述預測 — [摘要] 索引標籤

[摘要] 索引標籤描述 Tableau 已建立的預測模型,以及 Tableau 在您的資料中發現的一般模式。

用於建立預測的選項

此部分匯總了 Tableau 建立預測所用的選項。這些選項可由 Tableau 自動選取,也可在 [預測選項] 對話方塊中指定。

  • 時間系列 - 用於定義時間系列的連續日期欄位。在某些情況下,此值可能實際上不是日期。請參閱在檢視中沒有日期時進行預測

  • 度量 — 估計值時使用的度量。

  • 向前預測 — 預測的長度和日期範圍。

  • 預測依據 — 建立預測所用實際資料的日期範圍。

  • 忽略最後的週期數 — 實際資料末尾的週期數將被忽略,該數值用於確定預測資料顯示的週期數。此值由 [預測選項] 對話方塊中的 [忽略最後的週期數] 選項決定。

  • 季節模式 — Tableau 在資料中找到的季節週期的長度,如果在任何預測中都找不到季節週期,則為 [無] 。

預測摘要表

對於預測的每個度量將顯示一個摘要表,用來描述預測。如果使用維度將檢視劃分為多個窗格,則會在每個表中插入一列,用來指示維度。預測摘要表中的欄位包括:

  • 初始 — 第一個預測週期的值和預測間隔。

  • 相對於初始值的變化 — 第一個和最後一個預測估計點之間的差值。這兩個點之間的間隔顯示在列標題中。當值以百分比形式顯示時,此欄位會顯示相對於第一個預測週期的百分比變化。

  • 季節影響 — 這些欄位將針對具有季節性(隨時間變化的重複模式)的模型而顯示。它們將顯示實際值和預測值的合併時間系列中上一個完整季節週期的季節元件的高值和低值。季節組件表示相對於趨勢的偏差,因此會圍繞零值變化,並且在整個季節內的和值為零。

  • 貢獻 — 趨勢和季節性對預測的貢獻程度。這些值始終以百分比形式表示,且總和為 100%。

  • 品質 — 指示預測與實際資料的相符程度。可能的值為 GOOD、OK 和 POOR。自然預測的定義為:下一週期的值估計將與當前週期的值相同。品質以與自然預測相比較的結果表示,例如, [OK] 表示相比自然預測,預測誤差更小; [GOOD] 表示預測誤差要小一半以上;而 [POOR] 則表示預測的誤差更大。

描述預測 — [模型] 索引標籤

[模型] 索引標籤提供了更詳盡的統計資訊以及預測下的霍爾特-溫特斯指數平滑模型的平滑系數值。對於預測的每個度量將顯示一個表,用來描述 Tableau 為該度量建立的預測模型。如果使用維度將檢視劃分為多個窗格,則會在每個表中插入一列,用來指示維度。表有以下部分:

模型

指定 [層級] [趨勢] [季節] 元件是否是用於組建預測的模型的一部分。每個元件的值為以下值之一:

  • - 模型中沒有該元件。

  • 累加 - 該組件存在,並且已新增到其他組件中以便建立整體預測值。

  • 累乘 - 該組件存在,並且已與其他組件相乘以便建立整體預測值。

品質指標

這組值提供有關模型品質的統計資訊。

定義
RMSE:均方誤差
MAE:平均絕對誤差

MASE:平均絕對標度誤差。

MASE 測量誤差量級與向前一期天真預測的誤差量級的比率。天真預測法假定不管今天是什麼值,明天都將是相同的值。因此,MASE 為 0.5 意味著您的預測的誤差可能是天真預測誤差的一半,這要優於 MASE 1.0,MASE 1.0 意味著您的預測並不比天真預測準確。由於這是為所有值定義的規範化統計數字並平均地衡量誤差,因此是比較不同預測方法的品質的理想指標。

與更常用的 MAPE 指標相比,MASE 的優點在於:MASE 是為包含零的時間系列定義的,MAPE 則不是。此外,MASE 為誤差賦予相等的權重,而 MAPE 為正誤差和/或極值誤差賦予更多權重。

MAPE:平均絕對百分比誤差。

MAPE 測量誤差量級與資料量級的百分比。因此,20% 的 MAPE 要優於 60% 的 MAPE。誤差是模型估計的回應值與資料中每個說明性值的實際回應值之間的差異。由於這是一種規範化統計資料,因此可用於比較 Tableau 中計算的不同模型的品質。但是,對於某些比較,它可能不可靠,因為它對某些種類的誤差設定的權重要大於其他誤差。此外,對於包含零值的資料,其效果也不明確。

AIC:Akaike 資訊準則。

AIC 是一個模型品質度量,由 Hirotugu Akaike 開發,可對複雜模型進行罰分以防止過度擬合。在該定義中,k 是估計參數的數量,包括初始狀態,SSE 是誤差平方和。

在上面的定義,用到的變數如下:

變數含義
t時間系列中的週期的索引。
n時間系列長度。
m一個季節/迴圈中的週期數。
A(t)週期為 t 時的時間系列的實際值。
F(t)週期為 t 時的擬合值或預測值。

殘數為:e(t) = F(t)-A(t)

平滑係數

根據資料的層級、趨勢或季節元件的演變速率對平滑係數進行優化,使得較新資料值的權重大於較早資料值,這樣就會將樣本內向前一步預測誤差最小化。Alpha 是層級平滑係數,Beta 是趨勢平滑係數,Gamma 是季節平滑係數。平滑係數越接近 1.00,執行的平滑越少,從而可實現快速元件變化且對最新資料具有較大依賴性。平滑係數越接近 0.00,執行的平滑越多,從而可實現逐漸元件變化且對最新資料具有較小依賴性。

 

感謝您的意見反應!已成功提交您的意見回饋。謝謝!