Beispiel – Untersuchen der weiblichen Lebenserwartung mit Vorhersagemodellierungsfunktionen
In diesem Beispiel wird die gespeicherte Datenquelle "Weltindikatoren" verwendet, die in Tableau integriert ist. Wir verwenden die Vorhersagemodellierungsfunktionen MODEL_QUANTILE und MODEL_PERCENTILE, um die Beziehungen zwischen den Gesundheitsausgaben pro Kopf, weiblicher Lebenserwartung und Geburtenrate zu untersuchen.
Beginnen wir mit einer Visualisierung, die die Gesundheitsausgaben jedes Landes mit der jeweiligen Lebenserwartung von Frauen vergleicht. Laden Sie die folgende Arbeitsmappe von Tableau Public herunter, um dem Beispiel folgen und auf die vorab erstellten Ansichten und Dashboards zugreifen oder die Lösung anzeigen zu können: Vorhersagemodellierung der Lebenserwartung von Frauen.
Verwenden von MODEL_PERCENTILE
Zunächst evaluieren wir die Lebenserwartung und die Gesundheitsausgaben für alle sichtbaren Markierungen. Dadurch kann Tableau anhand dieser Markierungen ein Modell erstellen und das Perzentil für jede Markierung innerhalb des Modells zurückgeben.
Schritt 1: Erstellen der Vorhersageberechnung
Wenn Sie auch Tableau Server oder Tableau Cloud verwenden und die Dokumenterstellung im Web statt in Tableau Desktop bevorzugen, veröffentlichen Sie die Arbeitsmappe auf Ihrem Tableau-Server, klicken Sie auf Arbeitsmappen, wählen Sie die Arbeitsmappe aus, und wählen Sie anschließend unter "Aktionen" die Option Arbeitsmappe bearbeiten aus.
Sobald Sie die Arbeitsmappe geöffnet haben, stellen Sie fest, dass sie mehrere Blätter umfasst. Mithilfe dieser Blätter erstellen Sie Ihre Ansichten.
Klicken Sie in der Startarbeitsmappe auf das Blatt Perzentil-Starter.
Öffnen Sie oben das Menü Analyse, und wählen Sie dann Berechnetes Feld erstellen aus.
Gehen Sie im "Berechnungseditor" wie folgt vor:
Benennen Sie die Berechnung: Perzentil Erwartung und Ausgaben im Vergleich
Geben Sie die folgende Formel ein:
MODEL_PERCENTILE(AVG([Life Expectancy Female]), LOG(MEDIAN([Health Exp/Capita])))
Klicken Sie auf OK.
Die Vorhersageberechnung wird nun als berechnetes Feld im Datenbereich hinzugefügt.
Bei dieser Berechnung werden die durchschnittliche Lebenserwartung als Zielausdruck und die durchschnittlichen Gesundheitsausgaben als Prädiktor verwendet. In diesem Fall haben wir eine logarithmische Transformation auf der Achse für die Gesundheitsausgaben und für den Prädiktor verwendet.
Schritt 2: Hinzufügen der Vorhersageberechnung zur Ansicht
In der Visualisierung sehen Sie die Gesundheitsausgaben der einzelnen Länder und die Lebenserwartung von Frauen gefiltert bis zum Jahr 2012.
Fügen wir der Ansicht nun die MODEL_PERCENTILE-Berechnung hinzu, um zu sehen, welche Einblicke wir erlangen.
Ziehen Sie Perzentil Erwartung und Ausgaben im Vergleich zu "Farbe" auf der Karte "Markierungen".
Klicken Sie auf den Dropdown-Pfeil auf dem Feld, und wählen Sie Berechnen per > Land/Region aus.
Klicken Sie auf der Karte "Markierungen" auf Farbe und dann auf Farben bearbeiten.
Wählen Sie unter "Palette" die Option Orange-Blau auseinanderlaufend aus.
Aktivieren Sie das Kontrollkästchen Abgestufte Farbe.
Aktivieren Sie das Kontrollkästchen Umgekehrt.
Klicken Sie auf OK.
Es wird die Verteilung der Länder angezeigt, in denen die Gesundheitserwartung auf der Grundlage des Ausgabenniveaus höher und niedriger ist als erwartet. Beachten Sie, dass die dunkelroten Markierungen im Allgemeinen darauf hindeuten, dass die Lebenserwartung im Verhältnis zu den Gesundheitsausgaben hoch ist. Dunkelblau bedeutet, dass die Lebenserwartung im Verhältnis zu den Gesundheitsausgaben niedrig ist, und Grau bedeutet, dass die Lebenserwartung in etwa den Erwartungen des Modells entspricht (basierend auf dem Niveau der Gesundheitsausgaben).
Schritt 3: Gruppieren der Ergebnisse nach Farbe
Zum Vereinfachen der Analyse verwenden wir die Vorhersageberechnung innerhalb einer neuen Berechnung, um die Ergebnisse zu gruppieren. Wir erstellen Gruppen, sodass Markierungen oberhalb des 90. Perzentils und unterhalb des 10. Perzentils, Markierungen im Bereich zwischen 80. und 90. Perzentil sowie im Bereich zwischen 10. und 20. Perzentil zusammen gruppiert werden usw. Außerdem heben wir Markierungen mit einem Nullwert hervor und adressieren diese später mit der anderen Vorhersagemodellierungsfunktion MODEL_QUANTILE.
Gehen Sie im "Berechnungseditor" wie folgt vor:
Benennen Sie die Berechnung: Perzentil nach Farbe.
Geben Sie die folgende Formel ein:
IF
ISNULL([Percentile Expectancy vs Spending])
THEN "Null"
ELSEIF [Percentile Expectancy vs Spending] >=0.9 OR
[Percentile Expectancy vs Spending] <=0.1
THEN "<10th & >90th percentile"
ELSEIF [Percentile Expectancy vs Spending] >=0.8 OR
[Percentile Expectancy vs Spending] <=0.2
THEN "<20th & >80th percentile"
ELSEIF [Percentile Expectancy vs Spending] >=0.7 OR
[Percentile Expectancy vs Spending] <=0.3
THEN "<30th & >70th percentile"
ELSEIF [Percentile Expectancy vs Spending] >=0.6 OR
[Percentile Expectancy vs Spending] <=0.4
THEN "<40th & >60th percentile"
ELSE "50th percentile +-10"
ENDFügen Sie die neue Berechnung zu Farbe auf der Karte "Markierungen" hinzu.
Klicken Sie auf den Dropdown-Pfeil auf dem Feld, und wählen Sie Berechnen per > Land/Region aus.
Klicken Sie auf der Karte "Markierungen" auf "Farbe" und dann auf Farben bearbeiten.
Passen Sie die Farben an, um den Trend besser sichtbar zu machen. In diesem Fall verwenden wir die Farbpalette Ampel und Grau für Nullen.
Klicken Sie auf OK.
Beim Betrachten der orangefarbenen Markierung in der Ecke fällt auf, dass in den USA pro Frau 8.895 $ für eine Lebenserwartung von 81 Jahren ausgegeben werden. Wenn Sie sich entlang der x-Achse nach links bewegen, können Sie sehen, dass andere Länder weniger ausgeben und die gleiche Lebenserwartung haben.
Das Modell bewertet die Stärke der Beziehung an jedem Punkt. Dabei befindet sich die USA in der Nähe des oberen Endes des erwarteten Bereichs für das Modell.
Schritt 4: Vergleichen der Lebenserwartung mit der Geburtenrate
Als Nächstes sehen wir uns eine Visualisierung an, die die Lebenserwartung von Frauen mit der Geburtenrate vergleicht. Beachten Sie, dass es eine negative Korrelation zwischen Geburtenraten und der Lebenserwartung von Frauen gibt. Dies bedeutet jedoch nicht, dass höhere Geburtenraten zu einer niedrigeren Lebenserwartung von Frauen führen. Wahrscheinlich existieren zusätzliche Faktoren, die sowohl die Geburtenraten als auch die Lebenserwartung von Frauen beeinflussen, die in dieser Ansicht der Daten nicht sichtbar sind. Fügen wir jedoch das Modell hinzu und untersuchen, wo das Modell davon ausgeht, dass die Lebenserwartung der Frauen angesichts der Gesundheitsausgaben höher oder niedriger ausfallen wird.
Fügen Sie auf dem Blatt Geburtenrate die Vorhersageberechnung Perzentil nach Farbe zu Farbe auf der Karte "Markierungen" hinzu, um sie in die Ansicht zu integrieren.
Klicken Sie auf den Dropdown-Pfeil auf dem Feld, und wählen Sie Berechnen per > Land/Region aus.
Klicken Sie auf der Karte "Markierungen" auf "Farbe" und dann auf Farben bearbeiten. Bearbeiten Sie die Farben wie zuvor, indem Sie die Palette Ampelund Grau für null verwenden.
Klicken Sie auf OK.
Jetzt sind die Daten deutlich stärker verteilt. Das rote Band in der unteren rechten Ecke ist der Punkt, an dem die Lebenserwartung am niedrigsten, aber die Geburtenrate am höchsten ist und an dem die Gesundheitsausgaben im Verhältnis zur Lebenserwartung niedrig sind. Wenn Sie die beiden roten Markierungen im oberen linken Quadranten herausgreifen, die zu Albanien und Armenien gehören, werden Sie feststellen, dass beide Länder eine hohe Lebenserwartung von Frauen, niedrigere Geburtenraten und niedrige Gesundheitsausgaben aufweisen.
Wie Sie sehen, konnten wir mit MODEL_PERCENTILE feststellen, dass diese beiden Länder Ausreißer sind: obwohl beide relativ niedrige Gesundheitsausgaben hatten, haben sie immer noch relativ hohe Lebenserwartungen, die im Zusammenhang mit der Geburtenrate stehen.
Sehen wir uns nun an, wie Sie die andere Vorhersagemodellierungsfunktion MODEL_QUANTILE verwenden können, um die Analyse fortzusetzen.
Verwenden von MODEL_QUANTILE
MODEL_QUANTILE wird verwendet, um numerische Vorhersagen mit einem Zielperzentil, Zielausdruck und Prädiktoren zu generieren. Sie ist die Umkehrung von MODEL_PERCENTILE.
Denken Sie daran, dass wir mehrere Nullwerte in unseren Ergebnissen haben, was bedeutet, dass für einige Länder keine Daten über Ausgaben vorliegen. Mithilfe von MODEL_QUANTILE werden wir diese fehlenden Werte schätzen.
Schritt 1: Erstellen der Vorhersageberechnungen
Wir haben mit der folgenden Berechnung gearbeitet:
MODEL_PERCENTILE(AVG([Life Expectancy Female]), LOG(MEDIAN([Health Exp/Capita])))
Zunächst möchten wir diese Funktion umkehren, um eine Vorhersage für die Gesundheitsausgaben basierend auf der Lebenserwartung von Frauen zu erhalten.
Klicken Sie in der Startarbeitsmappe auf das Blatt Quantil-Starter.
Öffnen Sie oben das Menü Analyse, und wählen Sie dann Berechnetes Feld erstellen aus.
Gehen Sie im "Berechnungseditor" wie folgt vor:
- Benennen Sie die Berechnung: Quantil der Lebenserwartung und Ausgaben im Vergleich
Geben Sie die folgende Formel ein:
POWER(10, MODEL_QUANTILE(0.5, LOG(MEDIAN([Health Exp/Capita])), AVG([Life Expectancy Female])))
Lassen Sie uns diese Berechnung aufschlüsseln, um sie besser zu verstehen:
- Wir beginnen mit MODEL_QUANTILE, wobei das erste Argument 0,5 ist. Es gibt an, welches Perzentil vorhergesagt werden soll.
- Der Zielausdruck sind die mittleren Gesundheitsausgaben pro Kopf.
- Der Prädiktor ist die durchschnittliche Lebenserwartung von Frauen.
- Darüber hinaus haben wir die Funktion in eine POWER-Funktion eingeschlossen, um den Protokoll-transformierten Zielausdruck wieder in Dollar zu konvertieren.
Klicken Sie auf OK.
Die Vorhersageberechnung wird nun als berechnetes Feld im Datenbereich hinzugefügt.
Schritt 2: Hinzufügen der Vorhersageberechnung zur Ansicht
Ziehen Sie Quantil der Lebenserwartung und Ausgaben im Vergleich zur QuickInfo auf der Karte "Markierungen".
Klicken Sie auf den Dropdown-Pfeil auf dem Feld, und wählen Sie Berechnen per > Land/Region aus.
Klicken Sie auf der Karte "Markierungen" auf QuickInfo und fügen Sie eine Zeile für die MODEL_QUANTILE-Vorhersage hinzu:
Benennen Sie die QuickInfo-Zeile: Vorhergesagte Gesundheitsausgaben anhand der Lebenserwartung von Frauen:
Klicken Sie auf Einfügen und wählen Sie die Berechnung aus, um sicherzustellen, dass die QuickInfo die eindeutige Vorhersage der Markierung dynamisch anzeigt, während Sie mit der Visualisierung interagieren.
Klicken Sie auf OK.
Momentan hat unsere MODEL_QUANTILE-Berechnung nur einen Prädiktor: die Lebenserwartung von Frauen. Beachten Sie beim Anzeigen der QuickInfo für Markierungen mit der gleichen Lebenserwartung von links nach rechts, dass die vorhergesagten Gesundheitsausgaben immer gleich sind. Indonesiens prognostizierte Gesundheitsausgaben anhand Lebenserwartung belaufen sich auf 336 $. Dasselbe gilt jedoch auch für Fidschi, Ägypten und andere Länder, in denen die Lebenserwartung von Frauen identisch ist.
Dies liegt daran, dass das Modell für jede Markierung die gleichen geschätzten Ausgaben bereitstellt. Da wir nur einen Prädiktor verwenden (Lebenserwartung von Frauen), gibt das Modell die gleichen Ergebnisse für alle Markierungen zurück, bei denen der Prädiktor denselben Wert hat. Sie können dem Modell mehr Nuancen hinzufügen, indem Sie weitere Prädiktoren hinzufügen.
Schritt 3: Hinzufügen einer Vorhersage mit einem zweiten Prädiktor
Beim Erstellen ihrer Vorhersagen sollten Sie berücksichtigen, welche Felder gute Prädiktoren für Ihre Zielwerte sind, und sie in Ihre Berechnungen einbeziehen. Sie können eine beliebige Anzahl von Dimensionen und Kennzahlen kombinieren. Beispielsweise könnten wir das BIP, die Bevölkerung und andere Bereiche als Prädiktoren hinzufügen, um unsere Vorhersagen zu verbessern. In diesem Fall fügen wir Region hinzu.
Gehen Sie im "Berechnungseditor" wie folgt vor:
Benennen Sie die Berechnung: Quantil der Ausgaben und Lebenserwartung/Region im Vergleich
Geben Sie die folgende Formel ein, die mit der vorherigen Berechnung identisch ist, bei der jedoch Region als Prädiktor hinzugefügt wurde:
POWER(10, MODEL_QUANTILE(0.5, LOG(MEDIAN([Health Exp/Capita])), AVG([Life Expectancy Female]), ATTR([Region])))
Klicken Sie auf OK.
Fügen Sie als Nächstes die neue Berechnung auf der Karte "Markierungen" der QuickInfo hinzu.
Klicken Sie auf QuickInfo und fügen Sie eine weitere Zeile zum Beschreiben der neuen Vorhersage hinzu, z. B. Vorhergesagte Gesundheitsausgaben anhand der Lebenserwartung von Frauen & Region:.
In der QuickInfo werden nun beide Vorhersagen angezeigt.
Schritt 4: Vergleichen der Ist-Werte mit vorhergesagten Werten
Im letzten Schritt bei der Analyse können Sie auch Vorhersageberechnungen erstellen, die Ist-Werte und vorhergesagte Werte kombinieren. In unserem Beispiel zeigen wir die tatsächlichen Gesundheitsausgaben (sofern verfügbar) und die geschätzten Ausgaben (sofern nicht verfügbar) an.
Gehen Sie im "Berechnungseditor" wie folgt vor:
Benennen Sie die Berechnung: Tatsächliche Gesundheitsausgaben und Vorhersagewert im Vergleich
Geben Sie die folgende Formel ein, die den numerischen Wert der Vorhersage zurückgibt:
ROUND(IFNULL(AVG([Health Exp/Capita]),[Quantile_HE/Cap_LEF,Region]),0)
Klicken Sie auf OK.
Erstellen Sie eine weitere Berechnung wie folgt:
Benennen Sie die Berechnung: Tatsächliche Gesundheitsausgaben und Vorhersage-Tag im Vergleich
Geben Sie die folgende Formel ein, die als Beschriftung für die obige Berechnung fungiert:
STR(IF ISNULL(AVG([Health Exp/Capita])) THEN "(Estimate)" ELSE "(Actual)" END)
Klicken Sie auf OK.
Fügen Sie als Nächstes beide Berechnungen der QuickInfo auf der Karte "Markierungen" der hinzu.
Klicken Sie auf QuickInfo und fügen Sie eine weitere Zeile hinzu, um die neuen Berechnungen zu beschreiben:
Gesundheitsausgaben pro Kopf (tatsächlich oder geschätzt):
Fügen Sie die neuen Berechnungen nacheinander ein.
Klicken Sie auf OK.
Wenn Sie nun mit der Visualisierung interagieren, können Sie für jedes Land die Gesundheitsausgaben pro Kopf oder eine Schätzung anzeigen, wenn der tatsächliche Wert in den Daten fehlt (wenn er null ist).
Ebenso können Sie mithilfe der Vorhersagemodellierungsfunktionen in Tableau Einblicke in Ihre Daten erhalten.