Scelta di un modello predittivo
Le funzioni di modellazione predittiva supportano la regressione lineare, la regressione lineare regolarizzata e la regressione con processo gaussiano. Questi modelli supportano diversi casi di utilizzo e tipi di previsioni, oltre ad avere limitazioni differenti.
Modelli supportati
Regressione lineare
La regressione lineare(Il collegamento viene aperto in una nuova finestra) (anche denominata regressione ordinaria dei minimi quadrati, o OLS) è ideale quando vi sono uno o più predittori che hanno una relazione lineare tra la previsione e la destinazione di previsione, non sono influenzati dalle stesse condizioni sottostanti e non rappresentano due istanze degli stessi dati (ad esempio, vendite espresse sia in dollari che in euro). La regressione lineare è il modello predefinito per le funzioni di modellazione predittiva in Tableau: se non specifichi un modello, verrà utilizzata la regressione lineare. Puoi specificare in modo esplicito questo modello includendo "model=linear" come primo argomento nel calcolo tabella.
Esempio:
MODEL_QUANTILE(
"model=linear",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)
Regressione lineare regolarizzata
La regressione lineare regolarizzata(Il collegamento viene aperto in una nuova finestra) è particolarmente indicata quando esiste una relazione lineare approssimativa tra due o più variabili indipendenti, anche denominata multicollinearità(Il collegamento viene aperto in una nuova finestra). Questo avviene spesso negli insiemi di dati reali. Per utilizzare questo modello anziché la regressione lineare predefinita, includi "model=rl" come primo argomento nel calcolo tabella.
Esempio:
MODEL_QUANTILE(
"model=rl",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)
Regressione con processo gaussiano
La regressione con processo gaussiano(Il collegamento viene aperto in una nuova finestra) è particolarmente indicata quando si generano previsioni in un dominio continuo, ad esempio il tempo o lo spazio, o quando esiste una relazione non lineare tra la variabile e la destinazione di previsione. La regressione con processo gaussiano in Tableau deve avere una singola dimensione ordinata come predittore, ma può includere più dimensioni non ordinate come predittori. Tieni presente che le misure non possono essere utilizzate come predittori nella regressione con processo gaussiano in Tableau. Per utilizzare questo modello anziché la regressione lineare predefinita, includi "model=gp" come primo argomento nel calcolo tabella.
Esempio:
MODEL_PERCENTILE(
"model=gp",
AVG([Days to Ship Actual]),
ATTR(DATETRUNC('month',([Order Date])))
)
Come semplice euristica, puoi utilizzare i seguenti criteri per selezionare il modello:
Regressione lineare (impostazione predefinita): da utilizzare quando disponi di un solo predittore e tale predittore ha una relazione lineare con la metrica di destinazione.
Regressione lineare regolarizzata: da utilizzare quando disponi di più predittori, soprattutto quando tali predittori hanno una relazione lineare con la metrica di destinazione e tali predittori sono probabilmente influenzati da relazioni o tendenze sottostanti simili.
Regressione con processo gaussiano: da utilizzare quando disponi di predittori di tempo o spazio o quando utilizzi predittori che potrebbero non avere una relazione lineare con la metrica di destinazione.