Erklärungsarten in "Erklär die Daten"
Jedes Mal, wenn Sie eine neue Markierung in einer Visualisierung oder einem Dashboard auswählen und "Erklär die Daten" ausführen, führt Tableau eine neue statistische Analyse unter Berücksichtigung dieser Markierung und der zugrunde liegenden Daten in der Arbeitsmappe aus. Mögliche Erklärungen werden in erweiterbaren Abschnitten für den Bereich "Erklär die Daten" angezeigt. Informationen darüber, wie Erklärungen von "Erklär die Daten" analysiert und evaluiert werden, finden Sie unter Funktionsweise von "Erklär die Daten".
Erkunden von zugrunde liegenden Werten
In diesem Abschnitt sind für jede erklärbare Kennzahl (die als Zielkennzahlen bezeichnet werden) Erklärungen angegeben. Jede hier aufgeführte Erklärung beschreibt eine Beziehung zu den Werten der Zielkennzahl, die an der analysierten Markierung getestet sind. Ob die von "Erklär die Daten" gefundenen Beziehungen aussagekräftig sind und es sich lohnt, sie näher zu untersuchen, müssen Sie nach Ihrem eigenen praktischen Sachverstand entscheiden.
Zugrunde liegende Merkmale
Diese Erklärungen beschreiben, welchen Beitrag Datensätze, die den Markierungen in der Ansicht zugrunde liegen, zu dem aggregierten Wert der erklärten Kennzahl leisten. Zu Markierungsattributen können Extremwerte, NULL-Werte, Anzahl der Datensätze oder der Durchschnittswert der Markierung gehören.
Hinweis: Definitionen von Begriffen, die in Erklärungen häufig verwendet werden, finden Sie unter Begriffe und Konzepte in Erklärungen(Link wird in neuem Fenster geöffnet).
Extremwerte
Erklärungen dieser Art zeigen an, ob ein oder mehrere Datensätze über Werte verfügen, die deutlich höher oder niedriger sind als die der meisten Datensätze. Wenn die Erklärung von einem Modell gestützt wird, weist das darauf hin, dass der Extremwert Auswirkungen auf die Zielkennzahl der analysierten Markierung hat.
Wenn eine Markierung über Extremwerte verfügt, bedeutet das nicht automatisch, dass es sich um Ausreißer handelt oder dass Sie deren Datensätze von der Ansicht ausschließen sollten. Diese Wahl liegt – abhängig von Ihrer Analyse – ganz bei Ihnen. Die Erklärung selbst weist einfach nur auf einen Extremwert in der Markierung hin. Zum Beispiel könnte ein falsch geschriebener Wert in einem Datensatz aufgedeckt werden, bei dem eine Banane 10 Dollar anstatt 10 Cent kostet. Oder es könnte sich herausstellen, dass ein bestimmter Verkäufer ein hervorragendes Quartal hatte.
Hinweis: Diese Erklärung muss vom Autor aktiviert werden, damit sie im Ansichtsmodus einer veröffentlichten Arbeitsmappe sichtbar ist. Weitere Informationen finden Sie unter Steuern des Zugriffs auf "Erklär die Daten".
Diese Erklärung zeigt Folgendes an:
Möglichkeiten für nähere Untersuchungen:
Nächste Schritte zur Analyse:
| In diesem Beispiel sorgt ein einzelner Extremwert von 463 Mietstunden dafür, dass die Gesamtmietzeit mit 613 Stunden höher als erwartet ausfällt. Ein wahrscheinlicher Grund für diesen hohen Wert könnte sein, dass jemand bei der Rückgabe vergessen hat, das Fahrrad anzudocken. In solch einem Fall würde der Autor diesen Wert möglicherweise für zukünftige Analysen ausschließen.
| |
Visualisierung des UnterschiedsDieser Abschnitt zeigt:
Möglichkeiten für nähere Untersuchungen:
Nächste Schritte zur Analyse:
| Wenn in diesem Beispiel der Extremwert "483" ausgeschlossen wird, liegt die analysierte Markierung – im Vergleich zu anderen Markierungen in der Ansicht – nicht mehr so hoch. Jetzt fallen andere Markierungen auf. Der Autor könnte nun die anderen Markierungen untersuchen, um festzustellen, warum diese anderen Standorte höhere Stundenzahlen für den Fahrradverleih haben. |
Nullwerte
Die Erklärungsart "NULL-Werte" weist auf Situationen hin, in denen mehr Daten in einer Markierung fehlen als erwartet. Sie gibt an, wie hoch der Anteil der NULL-Werte an den Zielkennzahlen ist und wie die NULL-Werte zum aggregierten Wert der jeweiligen Kennzahl beitragen können.
Diese Erklärung zeigt Folgendes an:
Möglichkeiten für nähere Untersuchungen:
Nächste Schritte zur Analyse:
| In diesem Beispiel wird der Prozentsatz der NULL-Werte in der Zielkennzahl als blauer Kreis dargestellt. |
Anzahl von Datensätzen
Diese Erklärungsart beschreibt, wenn die Anzahl der zugrunde liegenden Datensätze mit der Summe korreliert. Die Analyse ist auf einen Zusammenhang zwischen der Anzahl der in einer Markierung aggregierten Datensätze und dem tatsächlichen Wert der Markierung gestoßen.
Obwohl dies offensichtlich erscheinen mag, hilft Ihnen diese Erklärungsart herauszufinden, ob der Wert der Markierung von der Höhe der Werte in den Datensätzen oder einfach nur von der Anzahl der Datensätze in der analysierten Markierung beeinflusst wird.
Diese Erklärung zeigt Folgendes an:
Möglichkeiten für nähere Untersuchungen:
Nächste Schritte zur Analyse:
| In diesem Beispiel wird die Anzahl der Datensätze für die Fahrstrecke für jeden Wert von Fahrmonat aufgelistet, der eine Dimension in der ursprünglichen Visualisierung ist. Für den August ist der höchste Gesamtwert für die Fahrstrecke verzeichnet. Sie können nun untersuchen, ob der August den höchsten Wert für die Fahrstrecke hat, weil im August mehr Fahrten stattgefunden haben oder weil einige Fahrten länger waren. |
Durchschnittswert der Markierung
Diese Erklärungsart beschreibt, wenn der Durchschnitt einer Kennzahl mit der Summe korreliert. Vergleichen Sie, ob der Durchschnittswert niedrig oder hoch ist oder ob die Anzahl der Datensätze niedrig oder hoch ist.
Diese Erklärung zeigt Folgendes an:
Möglichkeiten für nähere Untersuchungen:
Nächste Schritte zur Analyse:
| In diesem Beispiel liegt die durchschnittliche Fahrstrecke für August nicht wesentlich höher oder niedriger als in den meisten Monaten. Dies deutet darauf hin, dass die Fahrstrecke im August ausfiel, weil mehr Fahrten stattgefunden haben, und nicht weil Kunden längere Fahrten unternommen haben. |
Beitragender Einzelwert
Verwenden Sie diese Erklärung, um die Zusammensetzung der Datensatzwerte zu verstehen, aus denen die analysierte Markierung besteht.
Diese Erklärungsart zeigt an, wenn möglicherweise ein einzelner Wert in einer nicht visualisierten Dimension einen Beitrag zum Gesamtwert der analysierten Markierung leistet. Eine nicht visualisierte Dimension ist eine Dimension, die in der Datenquelle vorhanden ist, aber in der Ansicht gerade nicht verwendet wird.
Diese Erklärung zeigt an, wenn jeder einer Dimension zugrunde liegende Datensatz denselben Wert hat oder wenn ein Dimensionswert auffällt, weil entweder viele oder einige wenige Datensätze den gleichen Einzelwert für die analysierte Markierung haben.
Hinweis: Definitionen von Begriffen, die in Erklärungen häufig verwendet werden, finden Sie unter Begriffe und Konzepte in Erklärungen(Link wird in neuem Fenster geöffnet).
Diese Erklärung zeigt Folgendes an:
Möglichkeiten für nähere Untersuchungen:
Nächste Schritte zur Analyse:
| In diesem Beispiel hat die statistische Analyse ergeben, dass viele der Fahrten aus der Gegend der Station "Back Bay" stammen. Beachten Sie, dass "Stationsgegend" eine nicht visualisierte Dimension ist, die laut den Daten, die der Quellvisualisierung zugrunde liegen, in einer gewissen Beziehung zur Fahrstrecke steht. |
stärkste Faktoren
Verwenden Sie diese Erklärung, um die Werte anzuzeigen, die den größten Teil der analysierten Marke ausmachen.
Bei einer COUNT-Aggregation zeigt "Wichtigste Beitragende" Dimensionswerte mit den meisten Datensätzen an. Bei SUM zeigt diese Erläuterung Dimensionswerte mit der größten Teilsumme an.
Beitragende Dimensionen
Verwenden Sie diese Erklärung, um die Zusammensetzung der Datensatzwerte zu verstehen, aus denen die analysierte Markierung besteht.
Diese Erklärungsart zeigt, dass die Verteilung einer nicht visualisierten Dimension möglicherweise einen Beitrag zum aggregierten Wert der analysierten Markierung leistet. Diese Art von Erklärung wird für Summen, Zählerstände und Durchschnitte von Zielkennzahlen verwendet. Eine nicht visualisierte Dimension ist eine Dimension, die in der Datenquelle vorhanden ist, aber in der Ansicht gerade nicht verwendet wird.
Hinweis: Definitionen von Begriffen, die in Erklärungen häufig verwendet werden, finden Sie unter Begriffe und Konzepte in Erklärungen(Link wird in neuem Fenster geöffnet).
Diese Erklärung zeigt Folgendes an:
Möglichkeiten für nähere Untersuchungen:
Nächste Schritte zur Analyse:
| In diesem Beispiel hat die statistische Analyse ergeben, dass mehr Fahrten von South Station und MIT und weniger Fahrten von Charles Circle und Kendall aus unternommen wurden, verglichen mit Fahrten, die insgesamt für Markierungen unternommen wurden. Beachten Sie, dass "Stationsname" eine nicht visualisierte Dimension ist, die laut den Daten, die der Quellvisualisierung zugrunde liegen, in einer gewissen Beziehung zur Fahrstrecke steht. |
Beitragende Kennzahlen
Diese Erklärungsart zeigt, dass der Durchschnitt einer nicht visualisierten Kennzahl möglicherweise einen Beitrag zum aggregrierten Wert der analysierten Markierung leistet. Eine nicht visualisierte Kennzahl ist eine Kennzahl, die in der Datenquelle vorhanden ist, aber in der Ansicht gerade nicht verwendet wird.
Diese Erklärung kann eine lineare oder quadratische Beziehung zwischen der nicht visualisierten Kennzahl und der Zielkennzahl aufdecken.
Hinweis: Definitionen von Begriffen, die in Erklärungen häufig verwendet werden, finden Sie unter Begriffe und Konzepte in Erklärungen(Link wird in neuem Fenster geöffnet).
Diese Erklärung zeigt Folgendes an:
Möglichkeiten für nähere Untersuchungen:
Nächste Schritte zur Analyse:
| In diesem Beispiel wäre ein möglicher Grund für die hohe Fahrstrecke, dass auch die durchschnittliche Gesamtmietzeit hoch ist. |
Weitere zu untersuchende Dinge
Dieser Abschnitt gibt mögliche Gründe dafür an, warum die analysierte Markierung einmalig oder unüblich ist. Diese Erklärungen:
- Erklären nicht, warum der Wert dieser Markierung so ist, wie er ist.
- Stehen in keinem Zusammenhang mit dem Wert der Kennzahlen in der Quellvisualisierung.
- Berücksichtigen keinerlei Zielkennzahlen.
Weitere interessante Dimensionen
Verwenden Sie diese Erklärung, um die Zusammensetzung der Datensatzwerte zu verstehen, aus denen die analysierte Markierung besteht.
Die Verteilung einer nicht visualisierten Dimension in der analysierten Markierung ist im Vergleich zur Verteilung der Werte für alle anderen Markierungen in der Ansicht ungewöhnlich. Eine nicht visualisierte Dimension ist eine Dimension, die in der Datenquelle vorhanden ist, aber in der Ansicht gerade nicht verwendet wird.
Hinweis: Definitionen von Begriffen, die in Erklärungen häufig verwendet werden, finden Sie unter Begriffe und Konzepte in Erklärungen(Link wird in neuem Fenster geöffnet).
Diese Erklärung zeigt Folgendes an:
Möglichkeiten für nähere Untersuchungen:
Nächste Schritte zur Analyse:
| In diesem Beispiel steht ein hoher prozentualer Anteil von Datensätzen mit bewölktem Wetter im Zusammenhang. Da es sich bei den Daten um Fahrradverleihvorgänge in Boston handelt und die analysierte Markierung die Fahrstrecke für August ist, können wir davon ausgehen, dass das Wetter normalerweise warm und feucht ist. An bewölkten Tagen hätten die Leute vielleicht öfter Fahrräder gemietet, um die Hitze zu vermeiden. Es ist auch möglich, dass es im August mehr bewölkte Tage gab. |