選擇預測模型
預測建模函數支援線性回歸、正則化線性回歸和高斯過程回歸。這些模型支援不同的使用案例和預測類型,並且具有不同的限制。
支援的模型
線性回歸
在以下情況中,最好使用線性回歸(連結在新視窗開啟)(也稱為普通最小平方回歸或 OLS):預測和預測目標之間存在具有線性關係的一個或多個預測值,這些預測值不受相同基礎條件的影響並且不代表相同資料的兩個執行個體(例如,以美元和歐元表示的銷售額)。線性回歸是 Tableau 中預測建模函數的預設模型;若未指定模型,則會使用線性回歸。可以在表計算中包括「model=linear」作為第一個引數,以明確指定此模型。
範例:
MODEL_QUANTILE(
"model=linear",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)
正則化線性回歸
在以下情況中,最好使用正則化線性回歸(連結在新視窗開啟):兩個或多個自變數之間存在近似線性關係(也稱為多重共線性(連結在新視窗開啟))。在真實的資料集中會經常觀察到這種情況。若要使用此模型,而不是預設的線性回歸,請在表計算中包括「model=rl」作為第一個引數。
範例:
MODEL_QUANTILE(
"model=rl",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)
高斯過程回歸
在以下情況中,最好使用高斯過程回歸(連結在新視窗開啟):在連續的範圍中產生預測,如時間或空間,或變數與預測目標之間存在非線性關係。Tableau 中的高斯過程回歸必須具有單個有序的維度作為預測值,但可能包括多個無序的維度作為預測值。請注意,在 Tableau 中,度量不能用作高斯過程回歸中的預測值。若要使用此模型,而不是預設的線性回歸,請在表計算中包括「model=gp」作為第一個引數。
範例:
MODEL_PERCENTILE(
"model=gp",
AVG([Days to Ship Actual]),
ATTR(DATETRUNC('month',([Order Date])))
)
簡單的啟發學習法是,選取模型時,可以使用下方的準則:
線性回歸(預設):僅有一個預測值且該預測值與目標指標之間具有線性關係時,請使用該模型。
正則化線性回歸:具有多個預測值,尤其是這些預測值與目標指標之間具有線性關係,並且這些預測值可能受到相似的基礎關係或趨勢影響時,請使用該模型。
高斯過程回歸:具有時間或空間預測值,或者使用的預測值與目標指標之間可能沒有線性關係時,請使用該模型。