Auswählen eines Vorhersagemodells
Die Vorhersagemodellierungsfunktionen unterstützen die lineare Regression, die regularisierte lineare Regression und die gaußsche Prozessregression. Diese Modelle unterstützen verschiedene Anwendungsfälle und Vorhersagetypen und weisen unterschiedliche Einschränkungen auf.
Unterstützte Modelle
Lineare Regression
Die lineare Regression(Link wird in neuem Fenster geöffnet) (auch als normale Regression der kleinsten Quadrate oder OLS bezeichnet) wird am besten verwendet, wenn es einen oder mehrere Prädiktoren gibt, für die eine lineare Beziehung zwischen der Vorhersage und dem Vorhersageziel besteht, wenn sie nicht von den gleichen zugrunde liegenden Bedingungen beeinflusst werden und nicht zwei Instanzen derselben Daten darstellen (z. B. Verkäufe, die in Dollar und Euro ausgedrückt werden). Die lineare Regression ist das Standardmodell für Vorhersagemodellierungsfunktionen in Tableau. Wenn Sie kein Modell angeben, wird eine lineare Regression verwendet. Sie können dieses Modell explizit angeben, indem Sie "model=linear" als erstes Argument in die Tabellenberechnung einbeziehen.
Beispiel:
MODEL_QUANTILE(
"model=linear",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)
Regularisierte lineare Regression
Die regularisierte lineare Regression(Link wird in neuem Fenster geöffnet) wird am besten verwendet, wenn es eine ungefähre lineare Beziehung zwischen zwei oder mehr unabhängigen Variablen gibt, was auch als Multikollinearität(Link wird in neuem Fenster geöffnet) bezeichnet wird. Dies ist häufig in realen Datensätzen der Fall. Um anstelle der standardmäßigen linearen Regression dieses Modell zu verwenden, fügen Sie "model=rl" als erstes Argument in die Tabellenberechnung ein.
Beispiel:
MODEL_QUANTILE(
"model=rl",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)
Gaußsche Prozessregression
Die gaußsche Prozessregression(Link wird in neuem Fenster geöffnet) wird am besten verwendet, wenn Vorhersagen über eine fortlaufende Domäne wie Zeit oder Raum hinweg generiert werden oder wenn eine nichtlineare Beziehung zwischen der Variablen und dem Vorhersageziel besteht. Die gaußsche Prozessregression in Tableau muss eine einzige geordnete Dimension als Prädiktor aufweisen, kann jedoch mehrere ungeordnete Dimensionen als Prädiktoren enthalten. Beachten Sie, dass in der gaußschen Prozessregression in Tableau Kennzahlen nicht als Prädiktoren verwendet werden können. Um anstelle der standardmäßigen linearen Regression dieses Modell zu verwenden, fügen Sie "model=gp" als erstes Argument in die Tabellenberechnung ein.
Beispiel:
MODEL_PERCENTILE(
"model=gp",
AVG([Days to Ship Actual]),
ATTR(DATETRUNC('month',([Order Date])))
)
Als einfache Heuristik können Sie die folgenden Kriterien für die Auswahl Ihres Modells verwenden:
Lineare Regression (Standard): verwenden Sie diese Option, wenn Sie nur über einen Prädiktor verfügen und wenn für diesen Prädiktor eine lineare Beziehung zu Ihrer Zielmetrik besteht.
Regularisierte lineare Regression: verwenden Sie diese Funktion, wenn Sie über mehrere Prädiktoren verfügen, insbesondere wenn diese Prädiktoren eine lineare Beziehung zur Zielmetrik aufweisen und diese Prädiktoren wahrscheinlich von ähnlichen zugrunde liegenden Beziehungen oder Trends beeinflusst werden.
Gaußsche Prozessregression: verwenden Sie diese Option, wenn Sie über Prädiktoren für Zeit oder Raum verfügen oder wenn Sie Prädiktoren verwenden, die möglicherweise keine lineare Beziehung zur Zielmetrik haben.