Prädiktive Modellierung mit generierten Markierungen

Wenn Sie Tableau schon eine Weile verwenden, haben Sie möglicherweise bereits den Ausdruck "Datenverdichtung" gehört. Dies bezieht sich auf einen Prozess, bei dem Markierungen von Tableau generiert und der Ansicht hinzugefügt werden, obwohl diese Markierungen nicht von Datensätzen in der zugrunde liegenden Datenquelle unterstützt werden. Dies kann zum Erweitern einer Datumsachse oder zum Anzeigen von Vorhersagen erfolgen, wenn Sie mit Prädiktiven Modellierungsfunktionen arbeiten.

Video ansehen: Für eine ausführliche Diskussion über die Verdichtung von Daten, schauen Sie sich diese Präsentation von TC19 an: You Did What to Your Data? A Deep Dive into Imputing and Densifying Data.

Erfahren Sie mehr: Sehen Sie sich diesen Blogbeitrag zur Datenverdichtung von Data Plus Science an.

Vorhersagen für fehlende Werte berechnen

Sie können z. B. Vorhersagen für zukünftige Datumsangaben hinzufügen. Standardmäßig werden fehlende Werte in Tableau nicht angezeigt, aber Sie können diese Markierungen wie folgt generieren:

  1. Klicken Sie mit der rechten Maustaste (bzw. bei Mac-Computern bei gedrückter Ctrl-Taste) auf die Datums- oder Partitionskopfzeile.

  2. Wählen Sie Fehlende Werte anzeigen aus.

    Feldkontextmenü mit der Option "Fehlende Werte anzeigen" ausgewählt

  3. Aber das reicht für Vorhersagen für diese generierten Markierungen nicht aus. Wenn Sie versucht haben, eine Berechnung dafür durchzuführen (ob dies eine Vorhersageberechnung ist oder nicht), gibt Tableau Nullwerte aus. Dies ist zu erwarten, da diese Markierungen auf fehlenden Werten basieren, die nicht existieren.

    Um Vorhersagen für diese fehlenden Werte zu treffen, öffnen Sie oben das Menü Analyse, und wählen Siedann Eigenschaften aus fehlenden Werten ableiten aus.

    Analysemenü mit der Option "Eigenschaften aus fehlenden Werten ableiten" ausgewählt

    Hinweis: Die Standardeinstellung ist, dass Eigenschaften aus fehlenden Werten ableiten deaktiviert ist, auch wenn Fehlende Werte anzeigen aktiviert ist. Für jedes Feld oder jede Achse, die mit Fehlende Werte anzeigen erweitert werden kann, kann diese Einstellung angewendet werden.

Beispiel für Vorhersagen für generierte Markierungen

Lassen Sie uns nun dieses Verhalten weiter untersuchen. Wir vergleichen drei verschiedene Abbildungen, die zeigen, wie sich die Einstellungen Fehlende Werte anzeigen und Eigenschaften aus fehlenden Werten ableiten auf Ihre Visualisierung auswirken können, je nachdem, ob eine oder beide aktiviert oder deaktiviert sind. Laden Sie dafür die folgende Arbeitsmappe aus Tableau Public: Vorhersagen zu fehlenden Werten herunter.

Wir haben Vorhersagen mit ATTR(DAY([Order Date])) als Prädiktor aufgenommen. Dies ist nicht der beste Prädiktor für die Daten (und liefert unzureichende Vorhersagen), aber für die Zwecke dieses Artikels liefert er eine gute Veranschaulichung für die Funktion Eigenschaften aus fehlenden Werten ableiten.

Jede Visualisierung enthält die gleichen vier Maße im Bereich "Zeilen", wie unten beschrieben:

  • Zeile 1: SUM([Profit])
  • Zeile 2: RUNNING_SUM(SUM([Profit]))
  • Zeile 3: ATTR(DAY([Order Date]))
  • Zeile 4: MODEL_QUANTILE(0.5, SUM([Profit]),ATTR(DAY([Order Date])))

Abbildung 1

Abbildung 1

In der obigen Abbildung ist sowohl Fehlende Werte anzeigen als auch Eigenschaften aus fehlenden Werten ableiten deaktiviert, wobei es sich um die Standardeinstellungen in Tableau handelt.

Sie würden die gleiche Visualisierung sehen, wenn Eigenschaften aus fehlenden Werten ableiten aktiviert und Fehlende Werte anzeigen deaktiviert wäre. Dies liegt daran, dass Eigenschaften aus fehlenden Werten ableiten davon abhängt, dass Fehlende Werteanzeigen aktiviert ist.

Abbildung 2

Abbildung 2

Im obigen Bild ist Fehlende Werte anzeigen aktiviert und Eigenschaften von fehlenden Werten ableiten deaktiviert. Die Standardeinstellung ist, dass Eigenschaften aus fehlenden Werten ableiten deaktiviert ist, auch wenn Fehlende Werte anzeigen aktiviert ist.

Beachten Sie, dass wir in dieser Situation keinen Wert für ATTR auf DAY([Order Date]) für die fehlenden Werte berechnen (Zeile 3). Wir generieren zwar eine Vorhersage für die verdichteten Datumsangaben, aber diese sind für alle fehlenden Datumsangaben identisch, da wir nicht in der Lage sind, die tatsächliche ATTR(DAY([Order Date])) abzuleiten, wie in Zeile 3 gezeigt. Diese Markierungen werden effektiv so berechnet, als ob DAY([Order Date]) null wäre.

Abbildung 3

Abbildung 3

In diesem Bild ist sowohl Fehlende Werte anzeigen als auch Eigenschaften aus fehlenden Werten ableiten aktiviert, um die Einstellung Eigenschaften aus fehlenden Werten ableiten in Aktion zu veranschaulichen.

Wie Sie sehen können, sind wir in der Lage, die ATTR(DAY([Order Date])) (Zeile 3) abzuleiten und können diese daher für Vorhersagen in Zeile 4 verwenden und erhalten eine schöne glatte Kurve mit Vorhersagen.

Vielen Dank für Ihr Feedback!Ihr Feedback wurde erfolgreich übermittelt. Vielen Dank.