Funktionsweise von Prognosen in Tableau

Prognosen in Tableau verwendet eine Methode, die als exponentielle Glättung bekannt ist. Prognosealgorithmen versuchen, ein regelmäßiges Muster in den Kennzahlen zu finden, das in der Zukunft fortgesetzt werden kann. Wenn Sie an der prädikativen Modellierung interessiert sind, die auch in Tableau verfügbar ist, finden Sie weitere Informationen unter Funktionsweise der Vorhersagemodellierungsfunktionen in Tableau.

Video anzeigen: Eine Präsentation der zugehörigen Konzepte in Tableau finden Sie im kostenlosen Schulungsvideo Prognosen(Link wird in neuem Fenster geöffnet) (Dauer: 6 Minuten). Verwenden Sie Ihr Konto tableau.com(Link wird in neuem Fenster geöffnet), um sich anzumelden.

Eine Prognose wird in der Regel in eine Ansicht eingefügt, die ein Datumsfeld und mindestens eine Kennzahl enthält. Falls kein Datum vorhanden ist, kann Tableau jedoch eine Prognose für eine Ansicht erstellen, die eine Dimension mit ganzzahligen Werten sowie mindestens eine Kennzahl umfasst.

Informationen zur Erstellung einer Prognose finden Sie unter Erstellen einer Prognose. Weitere Informationen zu Prognosen mithilfe einer ganzzahligen Dimension finden Sie unter Ausführen von Prognosen ohne Datum in der Ansicht.

Übersicht

Alle Prognosealgorithmen sind einfache Modelle eines realen Datenerstellungsprozesses (DGP, Data Generating Process). Bei einer Prognose mit hoher Qualität muss ein einfaches Muster im DGP dem von dem Modell beschriebenen Muster möglichst entsprechen. Qualitätsmetriken messen die Übereinstimmung des Modells mit dem DGP. Ist die Qualität niedrig, ist die von den Konfidenzbändern gemessene Genauigkeit nicht wichtig, da die Genauigkeit einer ungenauen Schätzung gemessen wird.

Tableau wählt automatisch die acht besten Modelle aus, wobei das beste Modell die qualitativ beste Prognosequalität generiert. Die Glättungsparameter für jedes Modell werden optimiert, bevor Tableau die Prognosequalität beurteilt. Die Optimierungsmethode ist global. Es ist daher nicht unmöglich, lokale optimale Glättungsparameter auszuwählen, die nicht auch global optimal sind. Anfangswertparameter werden zwar entsprechend der bewährten Methoden ausgewählt, allerdings nicht weiter optimiert. Es kann daher vorkommen, dass Anfangswertparameter nicht optimal sind. Die acht in Tableau verfügbaren Modelle werden an folgendem Speicherort in der OTexts-Website beschrieben: Eine Taxonomie der exponentiellen Glättungsmethoden(Link wird in neuem Fenster geöffnet)

Wenn in der Visualisierung nicht genug Daten vorliegen, versucht Tableau automatisch mit einer besseren zeitlichen Feinheit zu prognostizieren und aggregiert die Prognose dann wieder auf die Feinheit der Visualisierung zurück. Tableau bietet Vorhersagebänder, die aus einer geschlossenen Gleichung simuliert oder berechnet werden können. Alle Modelle mit einer multiplikativen Komponenten oder mit aggregierten Prognosen weisen simulierte Bänder auf, während alle anderen Modelle die geschlossenen Gleichungen verwenden.

Exponentielle Glättung und Trend

Exponentielle Glättungsmodelle prognostizieren iterativ Zukunftswerte für einen reguläre Zeitreihe von Werten anhand der gewichteten Werte aus der Vergangenheit der Reihe. Das einfachste Modell, Einfache Exponentielle Glättung, berechnet die nächste Ebene oder den Glättungswert aus einem gewichteten Durchschnitt des letzten tatsächlichen Werts und des letzten Werts der Ebene. Die Methode ist exponentiell, da jeder vorangegangene tatsächliche Wert in exponentiell steigender Weise Einfluss auf den Wert jeder Ebene hat. Dabei werden jüngeren Werten ein größeres Gewicht beigemessen.

Exponentielle Glättungsmodelle mit Trend- oder Saisonkomponenten sind wirkungsvoll, wenn die zu prognostizierende Kennzahl einen Trend oder Saisonalität über den Zeitraum hinweg zeigt, auf dem die Prognose aufbaut. Trend ist die Tendenz bei Daten, sich mit der Zeit zu erhöhen oder zu verringern. Saisonalität ist eine sich wiederholende, vorhersagbare Änderung eines Werts, wie z. B. die von der Jahreszeit abhängige jährliche Fluktuation bei der Temperatur.

Im Allgemeinen ist die Ergebnisprognose um so besser, je mehr Datenpunkte es in einer Zeitreihe gibt. Eine ausreichende Datenmenge ist insbesondere dann wichtig, wenn die Saisonalität in Modellen abgebildet werden soll, da das Modell komplizierter ist und mehr Sicherheiten in Form von Daten erforderlich macht, damit eine akzeptable Genauigkeit erreicht wird. Wenn Sie die Prognose jedoch mit Daten durchführen, die von mindestens zwei verschiedenen DGPs erstellt wurden, erhalten Sie eine schlechtere Prognose, da das Modell nur einem einzigen DGP entsprechen kann.

Saisonalität

Tableau testet auf einen saisonalen Zyklus mit der für die Zeitaggregation am typischsten Länge der Zeitreihe, für die die Prognose gemacht wird. Wenn Sie also nach Monaten aggregieren, sucht Tableau nach einem 12-Monats-Zyklus; wenn Sie nach Quartalen aggregieren, sucht Tableau nach einem 4-Monats-Zyklus, und wenn Sie nach Tagen aggregieren, sucht Tableau nach wöchentlicher Saisonalität. Wenn es in Ihrer Zeitreihe einen 6-Monats-Zyklus gibt, findet Tableau also vermutlich ein 12-Monats-Muster mit zwei ähnlichen untergeordneten Mustern. Wenn es jedoch in Ihrer Zeitreihe einen 7-Monats-Zyklus gibt, findet Tableau vermutlich überhaupt keinen Zyklus. In der Regel sind 7-Monats-Zyklen jedoch unüblich.

Tableau kann die Saisonlänge mit zwei Methoden bestimmen. Bei der ursprünglichen zeitlichen Methode wird die natürliche Saisonlänge der zeitlichen Granularität (TG) der Ansicht herangezogen. Die zeitliche Granularität bezeichnet die kleinste Zeiteinheit, die in der Ansicht ausgedrückt wird. Wenn die Ansicht beispielsweise ein fortlaufendes (grünes) Datum enthält, das auf Monate abgeschnitten ist, oder diskrete (blaue) Jahr- und Monats-Datumsbereiche, besitzt die Ansicht eine monatliche zeitliche Granularität. Bei der neuen, nicht zeitlichen Methode (ab Tableau 9.3) werden Saisonlängen von 2 bis 60 anhand der periodischen Regression auf mögliche Kandidaten geprüft.

Tableau wählt automatisch die bestmögliche Methode für eine bestimmte Ansicht aus. Wenn die Kennzahlen in einer Ansicht in Tableau anhand eines Datums sortiert werden und eine vierteljährliche, monatliche, wöchentliche, tägliche oder stündliche zeitliche Granularität vorliegt, sind die Saisonlängen mit großer Wahrscheinlichkeit gleich 4, 12, 13, 7 bzw. 24. Die fünf saisonalen, in Tableau unterstützten exponentiellen Glättungsmethoden werden also nur anhand der natürlichen Länge der TG konstruiert. Der AIC der fünf saisonalen Modelle und der drei nicht saisonalen Modelle werden verglichen und der niedrigste AIC wird zurückgegeben. (Erläuterungen zur AIC-Metrik finden Sie unter "Prognosebeschreibungen".)

Wenn die Prognosen in Tableau anhand einer ganzzahligen Dimension erfolgen, kommt die zweite Methode zum Einsatz. In diesem Fall gibt es keine zeitliche Granularität (TG); die potenziellen Saisonlängen müssen also aus den Daten abgeleitet werden.

Die zweite Methode gilt auch bei jährlicher zeitlicher Granularität. Jährliche Reihen weisen nur selten Granularität auf; falls doch, müssen sie ebenfalls aus den Daten abgeleitet werden.

Die zweite Methode gilt auch bei Ansicht mit minütlicher oder sekündlicher zeitlicher Granularität. Wenn diese Reihen Saisonalität aufweisen, sind die Saisonnlängen mit großer Wahrscheinlichkeit gleich 60. Ein regelmäßiger, realer Prozess kann jedoch in Intervallen erfolgen, die nicht mit der Zeiteinteilung nach der Uhr übereinstimmen. Bei Minuten und Sekunden wird in Tableau daher außerdem geprüft. ob die Daten abweichende Längen (ungleich 60) umfassen. Dies bedeutet nicht, dass Tableau zwei verschiedene Saisonlängen gleichzeitig modellieren kann. Stattdessen werden zehn saisonale Modelle geschätzt, davon fünf Modelle mit einer Saisonlänge von 60 und weitere fünf Modelle mit der aus den Daten abgeleiteten Saisonlänge. Die Prognose wird dann anhand des Modells mit dem niedrigsten AIC aus den zehn saisonalen oder drei nicht saisonalen Modellen berechnet.

Bei jährlichen, minütlichen oder sekündlichen Serien wird eine einzelne Saisonlänge aus den Daten getestet, wenn das Muster relativ eindeutig erkennbar ist. Bei ganzzahligen Reihen werden jeweils bis zu neun relativ eindeutige potenzielle Saisonlängen für alle fünf saisonalen Modelle geschätzt und das Modell mit dem niedrigsten AIC wird zurückgegeben. Falls keine wahrscheinlichen Kandidaten für die Saisonlänge vorliegen, werden nur die nicht saisonalen Modelle geschätzt.

Wenn potenzielle Saisonlängen in Tableau aus den Daten abgeleitet werden, wird der Modelltyp "Automatisch" im Dialogfeld "Prognoseoptionen" im Menü "Modelltyp" unverändert beibehalten. Bei der Option "Automatisch ohne Saisonalität" entfallen die gesamte Suche nach Saisonlängen und die Schätzungen der saisonalen Modelle, sodass die Leistung gesteigert wird.

Die Heuristik, nach der Tableau entscheidet, ob die aus den Daten abgeleiteten Saisonlängen verwendet werden sollen, ist abhängig von der Fehlerverteilung für die periodische Regression der einzelnen Kandidaten für die Saisonlängen. Wenn tatsächlich Saisonalität in den Daten vorliegt, ergibt die Zusammenstellung von Kandidaten für die Saisonlänge in der Regel eine oder zwei eindeutige Saisonlängen. Wird also ein einzelner Kandidat zurückgegeben, weist dies mit großer Wahrscheinlichkeit auf Saisonalität hin. In diesem Fall werden die saisonalen Modelle in Tableau anhand dieses Kandidaten für die jährliche, minütliche und sekündliche Granularität geschätzt. Eine Rückgabe von weniger als zehn Kandidaten (die maximale Anzahl) bedeutet eine mögliche Saisonalität. In diesem Fall werden die saisonalen Modelle in Tableau anhand aller zurückgegebenen Kandidaten für ganzzahlige Ansichten geschätzt. Wird die maximale Anzahl der Kandidaten zurückgegeben, bedeutet dies, dass bei den meisten Saisonlängen ähnliche Fehler aufgetreten sind. Saisonalität ist daher unwahrscheinlich. In diesem Fall werden in Tableau lediglich die nicht saisonalen Modelle für eine ganzzahlige oder jährliche Reihe geschätzt, für andere zeitliche Reihen lediglich die saisonalen Modelle mit natürlicher Saisonlänge.

Beim Modelltyp "Automatisch" für ganzzahlige, jährliche, minütliche und sekündliche Ansichten werden stets Kandidaten für die Saisonlänge aus den Daten abgeleitet, unabhängig davon, ob diese Kandidaten letztlich genutzt werden oder nicht. Die Modellschätzung nimmt deutlich mehr Zeit in Anspruch als die periodische Regression; es entstehen daher meist nur geringfügige Leistungseinbußen.

Modelltypen

Im Dialogfeld "Prognoseoptionen" können Sie den Modelltyp "Tableau-Benutzer" für die Prognose wählen. Die Einstellung Automatisch ist in der Regel für die meisten Ansichten optimal. Wenn Sie Benutzerdefiniert auswählen, können Sie die Trend- und Saisonmerkmale unabhängig angeben (Keine, Additiv oder Multiplikativ):

In einem additiven Modell werden die Beiträge der Modellkomponenten summiert. In einem multiplikativen Modell werden einige Komponentenbeiträge multipliziert. Multiplikative Modelle sorgen für eine erheblich bessere Prognosequalität bei Daten, deren Trend oder Saisonalität vom Umfang (Größenordnung) der Daten beeinflusst wird:

Beachten Sie, dass Sie kein benutzerdefiniertes Modell erstellen müssen, um eine multiplikative Prognose zu generieren: Die Einstellung Automatisch kann feststellen, ob eine multiplikative Prognose für Ihre Daten angemessen ist. Ein multiplikatives Modell kann jedoch nicht berechnet werden, wenn die zu prognostizierende Kennzahl mindestens einen Wert kleiner oder gleich Null enthält.

Prognose mit Zeit

Bei der Prognose mit einem Datum darf die Ansicht nur ein einziges Basisdatum enthalten. Teildaten werden unterstützt, müssen jedoch allesamt auf dasselbe zugrunde liegende Feld verweisen. Die Datumsangaben können sich in Zeilen, Spalten oder Markierungen befinden (nicht jedoch im Ziel "QuickInfo").

Tableau unterstützt drei Datumstypen, von denen zwei Typen für Prognosen herangezogen werden können:

  • Abgeschnittene Datumsangaben verweisen auf einen bestimmten Zeitpunkt mit bestimmter zeitlicher Granularität, beispielsweise Februar 2017. Diese Datumsangaben sind in der Regel fortlaufend, weisen also einen grünen Hintergrund in der Ansicht auf. Abgeschnittene Datumsangaben können für Prognosen herangezogen werden.

  • Datumsbereiche weisen auf ein bestimmtes Mitglied einer zeitlichen Kennzahl hin (z. B. Februar). Die Datumsbereiche werden jeweils durch ein eigenes, meist diskretes Feld (mit blauem Hintergrund) dargestellt. Für die Prognose ist mindestens ein Datumsbereich "Jahr" erforderlich. Die folgenden Datumsbereiche sind für Prognosen zulässig:

    • Jahr

    • Jahr + Quartal

    • Jahr + Monat

    • Jahr + Quartal + Monat

    • Jahr + Woche

    • Benutzerdefiniert: Monat/Jahr, Monat/Tag/Jahr

    Andere Datumsbereiche wie Quartal oder Quartal + Monat sind nicht für Prognosen zulässig. Weitere Informationen zu den verschiedenen Datumstypen finden Sie unter Konvertieren von diskreten Feldern in fortlaufende Felder und umgekehrt.

  • Exakte Datumsangaben verweisen auf einen bestimmten Zeitpunkt mit maximaler zeitlicher Granularität, beispielsweise 1. Februar 2012 um 14:23:45.0. Exakte Datumsangaben sind für Prognosen nicht zulässig.

Auch Prognosen ohne Datumsangabe sind möglich. Weitere Informationen finden Sie unter Ausführen von Prognosen ohne Datum in der Ansicht.

Feinheit und Trimmen

Wenn Sie eine Prognose erstellen, wählen Sie eine Datumsdimension, die eine Zeiteinheit festlegt, bei der Zeitwerte gemessen werden sollen. Tableau unterstützt eine Reihe solcher Zeiteinheiten, darunter Jahr, Quartal, Monat und Tag. Die von Ihnen gewählte Einheit für den Datumswert wird auch als Feinheit des Datums bezeichnet.

Die in Ihrer Kennzahl enthaltenen Daten sind in der Regel nicht genau an Ihrer Einheit von Feinheit ausgerichtet. Sie können Ihren Datumswert auf Quartale festlegen, dann müssen jedoch Ihre tatsächlichen Daten in der Mitte des Quartals enden – zum Beispiel Ende November. Dies kann Probleme verursachen, denn der Wert für diese Fraktion des Quartals wird im Prognosemodell als vollständiges Quartal behandelt, das folglich meist einen niedrigeren Wert hat, als ein vollständiges Quartal. Wenn das Prognosemodell diese Daten miteinbeziehen darf, ist das Prognoseergebnis ungenau. Die Lösung ist das Trimmen der Daten, so dass die nachfolgenden Zeiträume, die die Prognose verfälschen könnten, ignoriert werden. Verwenden Sie die Option "Letzte Ignorieren" im Dialogfeld für Prognoseoptionen, um solche partiellen Zeiträume zu entfernen oder zu trimmen. Die Standardeinstellung ist das Trimmen eines Zeitraums.

Erhalt von mehr Daten

Tableau benötigt für die Schätzung eines Trends mindestens fünf Datenpunkte in der Zeitreihe sowie genug Datenpunkte für mindestens zwei Saisons oder eine Saison zuzüglich fünf Zeiträume für die Schätzung von Saisonalität. Für die Schätzung eines Modells mit saisonalem 4-Quartals-Zyklus beispielsweise sind neun Datenpunkte (4 + 5) erforderlich, und mindestens 24 für die Schätzung eines Modells mit 12-Monats-Zyklus (2 x 12).

Wenn Sie Prognosen für eine Ansicht verwenden, die nicht über eine auseichende Anzahl von Datenpunkten für eine korrekte Prognose verfügt, kann Tableau in einigen Fällen genug Datenpunkte abrufen, um eine gültige Prognose zu erzeugen. Dies geschieht durch die Abfrage der Datenquelle für eine höhere Feinheitsebene.

  • Wenn Ihre Ansicht Daten für weniger als neun Jahre enthält, fragt Tableau standardmäßig Quartalsdaten bei der Datenquelle ab, gibt eine vierteljährliche Prognose ab und aggregiert die jährliche Prognose für die Anzeige in Ihrer Ansicht. Wenn sich daraus immer noch nicht genug Datenpunkte ergeben, erstellt Tableau eine monatliche Prognose und fügt die aggregierte jährliche Prognose wieder in Ihre Ansicht ein.

  • Wenn Ihre Ansicht Daten für weniger als neun Quartale enthält, prognostiziert Tableau standardmäßig eine monatliche Prognose und fügt die aggregierten Ergebnisse der vierteljährlichen Prognose in Ihre Ansicht ein.

  • Wenn Ihre Ansicht Daten für weniger als neun Wochen enthält, prognostiziert Tableau standardmäßig eine tägliche Prognose und fügt die aggregierten Ergebnisse für die wöchentliche Prognose in Ihre Ansicht ein.

  • Wenn Ihre Ansicht Daten für weniger als neun Tage enthält, gibt Tableau standardmäßig eine stündliche Prognose ab und fügt die aggregierten Ergebnisse für die täglichen Prognose in Ihre Ansicht ein.

  • Wenn Ihre Ansicht Daten für weniger als neun Stunden enthält, gibt Tableau standardmäßig eine minütliche Prognose ab und fügt die aggregierten Ergebnisse für die stündliche Prognose in Ihre Ansicht ein.

  • Wenn Ihre Ansicht Daten für weniger als neun Minuten enthält, gibt Tableau standardmäßig eine sekündliche Prognose ab und fügt die aggregierten Ergebnisse für die minütliche Prognose in Ihre Ansicht ein.

Diese Änderungen geschehen im Hintergrund und es ist keine Konfiguration erforderlich. Tableau nimmt keine Änderung am Erscheinungsbild Ihrer Visualisierung vor und ändert tatsächlich keinen Datumswert. Die Zusammenfassung des Prognosezeitraums wird in den Dialogfeldern "Prognose beschreiben" und "Prognoseoptionen" dennoch die tatsächlich verwendete Feinheit widerspiegeln.

Tableau kann nur mehr Daten erhalten, wenn die Aggregation für die zu prognostizierende Kennzahl SUM oder COUNT ist. Weitere Informationen zu verfügbaren Aggregationstypen und zur Änderung des Aggregationstyps finden Sie unter Datenaggregation in Tableau.

Vielen Dank für Ihr Feedback!