Välja en prediktiv modell

Prediktiva modelleringsfunktioner stöder linjär regression, reglerad linjär regression och gaussisk processregression. De här modellerna stöder olika användningsfall och prediktionstyper, och har dessutom olika begränsningar.

Modeller med stöd

Linjär regression

Linjär regression(Länken öppnas i ett nytt fönster) (även känd som regression av vanliga minsta kvadrater) är som mest behjälplig om det finns en eller fler prediktorer med en linjär relation mellan prediktionen och prediktionsmål som inte påverkas av samma underliggande förhållanden eller representerar två instanser av samma data (t.ex. försäljning som anges i både dollar och euro). Linjär regression är standard för prediktiva modeller i Tableau. Om du inte väljer en specifik modell används linjär regression. Det går att uttryckligen specificera modellen genom att inkludera ”model=linear” som första argument i tabellberäkningen.

Exempel:

MODEL_QUANTILE(
"model=linear",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)

Reglerad linjär regression

Reglerad linjär regression(Länken öppnas i ett nytt fönster) är som mest behjälplig om det finns en ungefärlig linjär relation mellan två fristående variabler – även kallat multikollinearitet(Länken öppnas i ett nytt fönster). Detta observeras ofta i verkliga datauppsättningar. Inkludera ”model=rl” som första argument i tabellberäkningen för att använda den här modellen i stället för den standardmässiga linjära regressionen.

Exempel:

MODEL_QUANTILE(
"model=rl",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)

Gaussisk processregression

Gaussisk processregression(Länken öppnas i ett nytt fönster) är som mest behjälplig vid skapande i kontinuerliga domäner, som tid och rum, eller om det finns en icke linjär relation mellan variabeln och prediktionsmålet. Vid gaussisk processregression i Tableau krävs en enskild sorterad dimension som prediktion, men den kan inkludera flera osorterade dimensioner som prediktorer. Tänk på att det inte går att använda mätvärden som prediktorer vid gaussisk processregression i Tableau. Inkludera ”model=gp” som första argument i tabellberäkningen för att använda den här modellen i stället för den standardmässiga linjära regressionen.

Obs! Sorterade dimensioner omfattar värden som används i sekvenser t.ex.MÅNAD. En osorterad dimension är en dimension vars värden inte har någon inneboende sekvens, som till exempel kön och färg.

Exempel:

MODEL_PERCENTILE(
"model=gp",
AVG([Days to Ship Actual]),
ATTR(DATETRUNC('month',([Order Date])))
)


Använd kriterierna nedan för att välja modell på ett enkelt heuristiskt sätt:

  • Linjär regression (standard): Använd om du endast har en prediktor och denna prediktor har en linjär relation med målvärdet.

  • Reglerad linjär regression: Använd om du har flera prediktorer, framför allt prediktorer med linjära relationer till mätvärdet och som troligtvis påverkas av liknande underliggande relationer och trender.

  • Gaussisk processregression: Använd om du använder tid- och rumsprediktorer eller prediktorer som saknar linjär relation med mätvärdet.

Tack för din feedback!Din feedback har skickats in. Tack!