Prognosebeschreibungen

Im Dialogfeld Prognose beschreiben werden die Prognosemodelle beschrieben, die Tableau für Ihre Visualisierung berechnet hat.

Wenn die Prognose aktiviert ist, können Sie dieses Dialogfeld durch Auswahl von Analyse > Prognose > Prognose beschreiben öffnen.

Die Informationen im Dialogfeld "Prognose beschreiben" sind schreibgeschützt. Sie können jedoch auf In Zwischenablage kopieren klicken und den Bildschirminhalt in ein bearbeitbares Dokument kopieren.

Das Dialogfeld Prognose beschreiben besitzt zwei Registerkarten: die Registerkarte Zusammenfassung und die Registerkarte Modelle.

Registerkarte "Prognose beschreiben – Zusammenfassung"

Auf der Registerkarte Zusammenfassung werden die von Tableau erstellten Prognosemodelle beschrieben sowie die von Tableau in den Daten aufgedeckten allgemeinen Muster.

Zur Erstellung von Prognosen verwendete Optionen

In diesem Abschnitt werden die Optionen zusammengefasst, anhand deren Tableau Prognosen erstellt hat. Diese Optionen wurden entweder automatisch von Tableau ausgewählt oder im Dialogfeld Prognoseoptionen angegeben.

  • Zeitreihen: Das fortlaufende Datumsfeld, über das die Zeitreihen definiert werden. In bestimmten Fällen ist dieser Wert kein Datum. Weitere Informationen finden Sie unter Ausführen von Prognosen ohne Datum in der Ansicht.

  • Kennzahlen: Die Kennzahlen, deren Werte geschätzt werden.

  • Prognose nach vorn: Die Länge und der Datumsbereich der Prognose.

  • Prognose basiert auf: Der Datumsbereich der tatsächlichen Daten, mit denen die Prognose erstellt wird.

  • Letzte ignorieren: Die Anzahl der Zeiträume am Ende der tatsächlichen Daten, die nicht berücksichtigt werden. Für diese Zeiträume werden Prognosedaten angezeigt. Der Wert wird durch die Option Letzte ignorieren im Dialogfeld "Prognoseoptionen" bestimmt.

  • Saisonale Muster: Die Länge des Saisonzyklus, den Tableau in den Daten gefunden hat, oder "Keine", wenn in der Prognose kein Saisonzyklus gefunden wurde.

Prognosezusammenfassungstabellen

Für jede prognostizierte Kennzahl wird eine Zusammenfassungstabelle angezeigt, in der die Prognose beschrieben wird. Wird die Ansicht mithilfe von Dimensionen in mehrere Bereiche unterteilt, wird in jede Tabelle eine Spalte eingefügt, die die Dimensionen kennzeichnet. Prognosezusammenfassungstabellen enthalten die folgenden Felder:

  • Anfang: Der Wert und das Vorhersage-Intervall des ersten Prognosezeitraums.

  • Vom Anfang an ändern: Die Differenz zwischen den ersten und den letzten Schätzwerten der Prognose. Das Intervall für diese zwei Punkte wird im Spaltenkopf angezeigt. Wenn die Werte als Prozentsätze angegeben sind, wird in diesem Feld die Änderung des Prozentsatzes im Hinblick auf den ersten Prognosezeitraum angezeigt.

  • Saisonaler Effekt: Diese Felder werden für Modelle angezeigt, für die Saisonalität, d. h. ein sich über die Zeit hinweg wiederholendes Muster, besteht. Sie zeigen den Höchst- und Tiefstwert der saisonalen Komponente des letzten vollständigen Saisonzyklus in kombinierter Reihenfolge mit der Zeitreihe aktueller und prognostizierter Werte an. Die saisonale Komponente drückt die Abweichung vom Trend aus und variiert im Bereich um null und ergibt im Lauf der Saison eine Summe von null.

  • Beitrag: Das Ausmaß, in dem Trend und Saisonalität zur Prognose beitragen. Diese Werte werden immer als Prozentsatz angegeben und ergeben in der Summe 100 %.

  • Qualität: Gibt an, wie gut die Prognose zu den tatsächlichen Daten passt. Mögliche Werte sind GUT, OK und SCHLECHT. Unter einer naiven Prognose versteht man eine Prognose, die für den nächsten Zeitraum den identischen Wert des aktuellen Zeitraums schätzt. Qualität wird relativ zur naiven Prognose ausgedrückt. Somit bedeutet OK, dass die Prognose wahrscheinlich weniger Fehler als eine naive Prognose hat, GUT bedeutet, dass die Prognose weniger als die Hälfte der Fehler hat, und SCHLECHT bedeutet, dass die Prognose mehr Fehler hat.

Registerkarte "Prognose beschreiben – Modelle"

Auf der Registerkarte Modelle befinden sich vollständigere statistische und Glättungskoeffizientenwerte für die exponentiellen Holt-Winters Glättungsmodelle, auf denen die Prognosen basieren. Für jede prognostizierte Kennzahl wird eine Tabelle angezeigt, welche die von Tableau für die Kennzahl erstellten Prognosemodelle beschreibt. Wird die Ansicht mithilfe von Dimensionen in mehrere Bereiche unterteilt, wird in jede Tabelle eine Spalte eingefügt, die die Dimensionen kennzeichnet. Die Tabelle ist in die folgenden Abschnitte unterteilt:

Modell

Gibt an, ob die Komponenten Ebene, Trend oder Saison Teil des Modells für die Generierung der Prognose sind. Jede Komponente besitzt einen der folgenden Werte:

  • Keine: Die Komponente ist im Modell nicht vorhanden.

  • Additiv: Die Komponente wird zur Bildung des prognostizierten Gesamtwertes zu den anderen Komponenten hinzugefügt.

  • Multiplikativ: Die Komponente wird zur Bildung des prognostizierten Gesamtwertes mit den anderen Komponenten multipliziert.

Qualitätsmetriken

Dieser Satz von Werten bietet statistische Informationen zur Qualität des Modells.

WertDefinition
RMSE: Wurzel aus der mittleren quadratischen Abweichung
MAE: Mittlere absolute Abweichung

MASE: Mittlere absolute skalierte Abweichung.

MASE misst die Größe der Abweichung im Vergleich zur Größe des Fehlers einer "naiven" Prognose für den nächsten Schritt als Verhältnis. Bei einer naiven Prognose wird davon ausgegangen, dass der morgige Wert dem heutigen Wert entspricht. Ein MASE-Wert von 0,5 bedeutet, dass die Prognose voraussichtlich die Hälfte der Fehlerquote aufweist wie eine naive Prognose. Das ist besser als ein MASE-Wert von 1,0, der keine Verbesserung gegenüber einer naiven Prognose bedeutet. Da es sich dabei um eine normalisierte Statistik handelt, die für alle Werte definiert ist und die Fehler gleichmäßig gewichtet, ist diese Angabe eine ausgezeichnete Metrik für den Vergleich der Qualität unterschiedlicher Prognosemethoden.

Der Vorteil von MASE im Vergleich zur geläufigeren MAPE-Metrik ist, dass MASE für Zeitreihen definiert wird, die Null enthalten, während dies bei MAPE nicht der Fall ist. Zudem gewichtet MASE Abweichungen einheitlich, während MAPE positiven und/oder extremen Abweichungen mehr Gewicht beimisst.

MAPE: Mittlere absolute prozentuale Abweichung.

MAPE misst die Größe der Abweichung im Vergleich zur Größe der Daten als Prozentwert. Ein MAPE-Wert von 20 % ist also besser als ein MAPE-Wert von 60 %. Fehler ergeben sich aufgrund der Unterschiede zwischen den Antwortwerten, die das Modell abschätzt, und den tatsächlichen Antwortwerten für jeden erklärenden Wert in den Daten. Da es sich dabei um eine normalisierte Statistik handelt, kann damit die Qualität der unterschiedlichen in Tableau berechneten Modelle verglichen werden. Manche Vergleiche sind jedoch unzuverlässig, da bestimmte Fehlerarten größeres Gewicht haben als andere Fehlerarten. Außerdem gibt es keine Definition für Daten mit Nullwerten.

AIC: Akaike Information Criterion.

AIC ist eine Kennzahl für die Modellqualität. Sie wurde von Hirotugu Akaike entwickelt und "bestraft" komplexe Modelle, um Overfitting zu vermeiden. In dieser Definition ist k die Anzahl der geschätzten Parameter, einschließlich Ausgangszustände, und SSE die Summe der quadratischen Fehler.

Die Variablen in den vorangegangenen Definitionen haben folgende Bedeutungen:

VariableBedeutung
tIndex eines Zeitraums in einer Zeitreihe
nLänge der Zeitreihe
mAnzahl an Zeiträumen in einer Saison/einem Zyklus
A(t)Tatsächlicher Wert der Zeitreihe zum Zeitraum t
F(t)Angepasster oder Prognosewert zum Zeitraum t

Residuen: e(t) = F(t)-A(t)

Glättungskoeffizienten

Abhängig von der Entwicklungsrate der Ebenen-, Trend- oder saisonbedingten Datenkomponenten werden Glättungskoeffizienten so optimiert, dass aktuelleren Datenwerten mehr Gewicht beigemessen wird als älteren, wodurch die Abweichungen für vorausschauende Prognosen innerhalb eines Beispiels minimiert werden. Alpha bezeichnet den Glättungskoeffizienten der Ebene, Beta den Glättungskoeffizienten des Trends und Gamma den saisonalen Glättungskoeffizienten. Je mehr sich ein Glättungskoeffizient der Zahl 1,00 nähert, desto weniger Glättung wird ausgeführt, d. h. schnelle Komponentenänderungen und eine hohe Verlässlichkeit der aktuellen Daten werden ermöglicht. Je mehr sich ein Glättungskoeffizient der Zahl 0,00 nähert, desto mehr Glättung wird ausgeführt, d. h. graduelle Komponentenänderungen werden ermöglicht und die Daten sind weniger verlässlich.

 

Vielen Dank für Ihr Feedback!Ihr Feedback wurde erfolgreich übermittelt. Vielen Dank.