Las funciones de modelado predictivo admiten regresión lineal, regresión lineal regularizada y regresión de proceso gaussiano. Estos modelos admiten diferentes casos de uso y tipos de predicción y tienen diferentes limitaciones.

Modelos compatibles

Regresión lineal

La regresión lineal(El enlace se abre en una ventana nueva) (también conocida como regresión de mínimos cuadrados ordinarios, u OLS) se suele utilizar cuando hay uno o más predictores que tienen una relación lineal entre la predicción y el destino de predicción, no se ven afectados por las mismas condiciones subyacentes y no representan dos instancias de los mismos datos (por ejemplo, ventas expresadas en dólares y euros). La regresión lineal es el modelo predeterminado para las funciones de modelado predictivo en Tableau; si no especifica un modelo, se utilizará la regresión lineal. Puede especificar explícitamente este modelo mediante la inclusión de "model=linear" como primer argumento en el cálculo de la tabla.

Ejemplo:

MODEL_QUANTILE(
"model=linear",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)

Regresión lineal regularizada

La regresión lineal regularizada(El enlace se abre en una ventana nueva) se suele utilizar cuando hay una relación lineal aproximada entre dos o más variables independientes, también conocida como multicolinealidad(El enlace se abre en una ventana nueva). Esto se observa con frecuencia en conjuntos de datos del mundo real. Para utilizar este modelo en lugar de la regresión lineal predeterminada, incluya "model=rl" como primer argumento en el cálculo de la tabla.

Ejemplo:

MODEL_QUANTILE(
"model=rl",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)

Regresión del proceso gaussiano

La regresión del proceso gaussiano(El enlace se abre en una ventana nueva) se suele utilizar al generar predicciones en un dominio continuo, como el tiempo o el espacio, o cuando hay una relación no lineal entre la variable y el destino de predicción. La regresión del proceso gaussiano en Tableau debe tener una única dimensión ordenada como predictor, pero puede incluir varias dimensiones desordenadas como predictores. Tenga en cuenta que las medidas no se pueden utilizar como predictores en la regresión de procesos gaussianos en Tableau. Para utilizar este modelo en lugar de la regresión lineal predeterminada, incluya "model=gp" como primer argumento en el cálculo de la tabla.

Nota: Una dimensión ordenada es cualquiera cuyos valores se pueden secuenciar, como un mes. Una dimensión desordenada es cualquiera cuyos valores no tienen una secuencia inherente, como el género o el color.

Ejemplo:

MODEL_PERCENTILE(
"model=gp",
AVG([Days to Ship Actual]),
ATTR(DATETRUNC('month',([Order Date])))
)


Como guía, puede utilizar los siguientes criterios para seleccionar su modelo:

  • Regresión lineal (predeterminada): se usa cuando solo tiene un predictor y ese predictor tiene una relación lineal con la métrica de destino.

  • Regresión lineal regularizada: se usa cuando tiene varios predictores, especialmente cuando esos predictores tienen una relación lineal con la métrica de destino y esos predictores probablemente se ven afectados por relaciones o tendencias subyacentes similares.

  • Regresión del proceso gaussiano: se usa cuando se tienen predictores de tiempo o espacio, o cuando se utilizan predictores que podrían no tener una relación lineal con la métrica de destino.

¡Gracias por sus comentarios!