Auswählen eines Vorhersagemodells

Die Vorhersagemodellierungsfunktionen unterstützen die lineare Regression, die regularisierte lineare Regression und die gaußsche Prozessregression. Diese Modelle unterstützen verschiedene Anwendungsfälle und Vorhersagetypen und weisen unterschiedliche Einschränkungen auf.

Unterstützte Modelle

Lineare Regression

Die lineare Regression(Link wird in neuem Fenster geöffnet) (auch als normale Regression der kleinsten Quadrate oder OLS bezeichnet) wird am besten verwendet, wenn es einen oder mehrere Prädiktoren gibt, für die eine lineare Beziehung zwischen der Vorhersage und dem Vorhersageziel besteht, wenn sie nicht von den gleichen zugrunde liegenden Bedingungen beeinflusst werden und nicht zwei Instanzen derselben Daten darstellen (z. B. Verkäufe, die in Dollar und Euro ausgedrückt werden). Die lineare Regression ist das Standardmodell für Vorhersagemodellierungsfunktionen in Tableau. Wenn Sie kein Modell angeben, wird eine lineare Regression verwendet. Sie können dieses Modell explizit angeben, indem Sie "model=linear" als erstes Argument in die Tabellenberechnung einbeziehen.

Beispiel:

MODEL_QUANTILE(
"model=linear",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)

Regularisierte lineare Regression

Die regularisierte lineare Regression(Link wird in neuem Fenster geöffnet) wird am besten verwendet, wenn es eine ungefähre lineare Beziehung zwischen zwei oder mehr unabhängigen Variablen gibt, was auch als Multikollinearität(Link wird in neuem Fenster geöffnet) bezeichnet wird. Dies ist häufig in realen Datensätzen der Fall. Um anstelle der standardmäßigen linearen Regression dieses Modell zu verwenden, fügen Sie "model=rl" als erstes Argument in die Tabellenberechnung ein.

Beispiel:

MODEL_QUANTILE(
"model=rl",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)

Gaußsche Prozessregression

Die gaußsche Prozessregression(Link wird in neuem Fenster geöffnet) wird am besten verwendet, wenn Vorhersagen über eine fortlaufende Domäne wie Zeit oder Raum hinweg generiert werden oder wenn eine nichtlineare Beziehung zwischen der Variablen und dem Vorhersageziel besteht. Die gaußsche Prozessregression in Tableau muss eine einzige geordnete Dimension als Prädiktor aufweisen, kann jedoch mehrere ungeordnete Dimensionen als Prädiktoren enthalten. Beachten Sie, dass in der gaußschen Prozessregression in Tableau Kennzahlen nicht als Prädiktoren verwendet werden können. Um anstelle der standardmäßigen linearen Regression dieses Modell zu verwenden, fügen Sie "model=gp" als erstes Argument in die Tabellenberechnung ein.

Hinweis: Eine geordnete Dimension ist eine beliebige Dimension, deren Werte sequenziert werden können, z. B. MONAT. Eine ungeordnete Dimension ist eine Dimension, deren Werte keine inhärente Reihenfolge haben, wie zum Beispiel Geschlecht oder Farbe.

Beispiel:

MODEL_PERCENTILE(
"model=gp",
AVG([Days to Ship Actual]),
ATTR(DATETRUNC('month',([Order Date])))
)


Als einfache Heuristik können Sie die folgenden Kriterien für die Auswahl Ihres Modells verwenden:

  • Lineare Regression (Standard): verwenden Sie diese Option, wenn Sie nur über einen Prädiktor verfügen und wenn für diesen Prädiktor eine lineare Beziehung zu Ihrer Zielmetrik besteht.

  • Regularisierte lineare Regression: verwenden Sie diese Funktion, wenn Sie über mehrere Prädiktoren verfügen, insbesondere wenn diese Prädiktoren eine lineare Beziehung zur Zielmetrik aufweisen und diese Prädiktoren wahrscheinlich von ähnlichen zugrunde liegenden Beziehungen oder Trends beeinflusst werden.

  • Gaußsche Prozessregression: verwenden Sie diese Option, wenn Sie über Prädiktoren für Zeit oder Raum verfügen oder wenn Sie Prädiktoren verwenden, die möglicherweise keine lineare Beziehung zur Zielmetrik haben.

Vielen Dank für Ihr Feedback!Ihr Feedback wurde erfolgreich übermittelt. Vielen Dank.