Escolha de um modelo preditivo

Funções de modelagem preditiva aceitam regressão linear, regressão linear regularizada e regressão do processo gaussiano. Esses modelos aceitam diferentes casos de uso e tipos de previsão, além de terem diferentes limitações.

Modelos compatíveis

Regressão linear

A regressão linear(O link abre em nova janela) (também conhecida como regressão de quadrados mínimos comuns, ou OLS) é melhor utilizada quando há um ou mais preditores que têm uma relação linear entre a previsão e o alvo de previsão, eles não são afetados pelas mesmas condições subjacentes, e não representam duas instâncias dos mesmos dados (por exemplo, vendas expressas em dólares e euros). A regressão linear é o modelo padrão para funções de modelagem preditiva no Tableau; se você não especificar um modelo, a regressão linear será usada. Você pode especificar explicitamente este modelo, incluindo "model=linear” como o primeiro argumento no cálculo da tabela.

Exemplo:

MODEL_QUANTILE(
"model=linear",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)

Regressão linear regularizada

A regressão linear regularizada(O link abre em nova janela) é melhor utilizada quando há uma relação linear aproximada entre duas ou mais variáveis independentes — também conhecida como multicolinearidade.(O link abre em nova janela) Isso é frequentemente observado em conjuntos de dados do mundo real. Para usar este modelo em vez da regressão linear padrão, inclua "model=rl” como o primeiro argumento no cálculo da tabela.

Exemplo:

MODEL_QUANTILE(
"model=rl",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)

Regressão do processo gaussiano

A regressão do processo gaussiano(O link abre em nova janela) é melhor utilizada ao gerar previsões em um domínio contínuo, como tempo ou espaço, ou quando há uma relação não linear entre a variável e o alvo de previsão. A regressão do processo gaussiano no Tableau deve ter uma única dimensão ordenada como preditor, mas pode incluir múltiplas dimensões não ordenadas como preditores. Observe que as medidas não podem ser usadas como preditores na regressão do processo gaussiano no Tableau. Para usar este modelo em vez da regressão linear padrão, inclua "model=gp” como o primeiro argumento no cálculo da tabela.

Observação: uma dimensão ordenada é qualquer uma cujos valores podem ser sequenciados, como MÊS. Uma dimensão não ordenada é qualquer uma cujos valores não têm uma sequência inerente, como gênero ou cor.

Exemplo:

MODEL_PERCENTILE(
"model=gp",
AVG([Days to Ship Actual]),
ATTR(DATETRUNC('month',([Order Date])))
)


Como uma heurística simples, você pode usar os critérios abaixo para selecionar seu modelo:

  • Regressão linear (padrão): use quando tiver apenas um preditor, e esse preditor tem uma relação linear com a métrica de destino.

  • Regressão linear regularizada: use quando você tem vários preditores, especialmente quando esses preditores têm uma relação linear com a métrica-alvo e são provavelmente afetados por relações ou tendências subjacentes semelhantes.

  • Regressão do processo gaussiano: use quando você tem preditores de tempo ou espaço, ou está usando preditores que podem não ter uma relação linear com a métrica-alvo.

Agradecemos seu feedback!Seu feedback foi enviado. Obrigado!