Een prognosemodel kiezen
Functies voor prognosemodellering ondersteunen lineaire regressie, geregulariseerde lineaire regressie en Gaussische procesregressie. Deze modellen ondersteunen verschillende gebruikscases en voorspellingstypen, en hebben ook verschillende beperkingen.
Ondersteunde modellen
Lineaire regressie
Lineaire regressie(Link wordt in een nieuw venster geopend) (ook bekend als gewone kleinste-kwadratenregressie of OLS) kan het beste worden gebruikt wanneer er een of meer predictors zijn met een lineaire relatie tussen de voorspelling en het voorspellingsdoel, ze niet worden beïnvloed door dezelfde onderliggende omstandigheden en ze niet twee exemplaren van dezelfde data vertegenwoordigen (bijvoorbeeld verkopen uitgedrukt in zowel dollars als euro's). Lineaire regressie is het standaardmodel voor prognosemodelleringsfuncties in Tableau. Als u geen model opgeeft, wordt lineaire regressie gebruikt. U kunt dit model expliciet opgeven door model=lineair als het eerste argument in uw tabelberekening op te nemen.
Voorbeeld:
MODEL_QUANTILE(
"model=linear",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)
Geregulariseerde lineaire regressie
U kunt geregulariseerde lineaire regressie(Link wordt in een nieuw venster geopend) het beste gebruiken wanneer er een benaderende lineaire relatie is tussen twee of meer onafhankelijke variabelen, ook bekend als multicollineariteit(Link wordt in een nieuw venster geopend). Dit wordt vaak waargenomen in datasets uit de praktijk. Om dit model te gebruiken in plaats van de standaard lineaire regressie, moet u model=rl als het eerste argument in uw tabelberekening opnemen.
Voorbeeld:
MODEL_QUANTILE(
"model=rl",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)
Gaussiaanse procesregressie
U kunt Gaussiaanse procesregressie(Link wordt in een nieuw venster geopend) het beste gebruiken bij het genereren van voorspellingen over een continu domein, zoals tijd of ruimte, of wanneer er een niet-lineaire relatie is tussen de variabele en het voorspellingsdoel. Gaussiaanse procesregressie in Tableau moet één enkele dimensie hebben geordend als predictor, maar kan meerdere ongeordende dimensies omvatten als predictors. Opmerking: Meetwaarden kunnen niet worden gebruikt als predictors in Gaussiaanse procesregressie in Tableau. Om dit model te gebruiken in plaats van de standaard lineaire regressie, moet u model=gp als het eerste argument in uw tabelberekening opnemen.
Voorbeeld:
MODEL_PERCENTILE(
"model=gp",
AVG([Days to Ship Actual]),
ATTR(DATETRUNC('month',([Order Date])))
)
Als eenvoudige heuristiek kunt u de onderstaande criteria gebruiken voor het selecteren van uw model:
Lineaire regressie (standaard): Gebruik dit wanneer u slechts één predictor hebt en die predictor een lineaire relatie heeft met uw doelstatistiek.
Geregulariseerde lineaire regressie: Gebruik dit wanneer u meerdere predictors hebt, vooral wanneer die predictors een lineaire relatie hebben met de doelstatistiek en die predictors waarschijnlijk worden beïnvloed door vergelijkbare onderliggende relaties of trends.
Gaussiaanse procesregressie: Gebruik dit wanneer u tijd- of ruimtepredictors hebt, of wanneer u predictors gebruikt die mogelijk geen lineaire relatie hebben met de doelstatistiek.