选择预测模型

预测建模函数支持线性回归、正则化线性回归和高斯过程回归。这些模型支持不同的用例和预测类型,并且具有不同的限制。

支持的模型

线性回归

线性回归(链接在新窗口中打开)(也称为普通最小二乘回归或 OLS)最适合用于预测和预测目标之间有线性关系的一个或多个预测因子,它们不受相同基础条件的影响,并且它们不表示同一数据的两个实例(例如,以美元和欧元表示的销售额)。线性回归是 Tableau 中预测建模函数的默认模型;如果不指定模型,则使用线性回归。通过包括“model=linear”作为表计算中的第一个参数来显式指定此模型。

示例:

MODEL_QUANTILE(
"model=linear",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)

正则化线性回归

当两个或多个独立变量之间有近似线性关系时,最好使用使用正则化线性回归(链接在新窗口中打开) — 也称为多线性(链接在新窗口中打开)。在真实数据集中会经常观察到这种情况。若要使用此模型而不是默认线性回归,请包括“model=rl”作为表计算中的第一个参数。

示例:

MODEL_QUANTILE(
"model=rl",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)

高斯过程回归

高斯过程回归(链接在新窗口中打开)最适合用于跨连续域(例如时间或空间)生成预测,或者变量与预测目标之间有非线性关系的情况。Tableau 中的高斯过程回归必须具有单个有序维度作为预测因子,但可能包含 多个无序维度作为预测因子。 请注意,在 Tableau 的高斯过程回归中,无法使用度量作为预测因子。若要使用此模型而不是默认线性回归,请包括“model=gp”作为表计算中的第一个参数。

注意有序维度是任何其值可以排序的维度,例如月份。无序维度是任何其值没有固有序列的维度(例如性别或颜色)。

示例:

MODEL_PERCENTILE(
"model=gp",
AVG([Days to Ship Actual]),
ATTR(DATETRUNC('month',([Order Date])))
)


作为一种简单的启发式方法,您可以使用以下条件来选择模型:

  • 线性回归(默认值):如果您只有一个预测因子,并且该预测因子与目标指标具有线性关系,则使用此项。

  • 正则化线性回归:如果您有多个预测因子,特别是当这些预测因子与目标指标有线性关系且预测因子可能受相似基础关系或趋势影响时,则使用此项。

  • 高斯过程回归:如果您有时间或空间预测因子,或者当您使用的预测变量可能与目标指标没有线性关系,则使用此项。

感谢您的反馈!