Erklärungsarten in "Erklär die Daten"

Jedes Mal, wenn Sie eine neue Markierung in einer Visualisierung oder einem Dashboard auswählen und "Erklär die Daten" ausführen, führt Tableau eine neue statistische Analyse unter Berücksichtigung dieser Markierung und der zugrunde liegenden Daten in der Arbeitsmappe aus. Mögliche Erklärungen werden in erweiterbaren Abschnitten für den Bereich "Erklär die Daten" angezeigt. Informationen darüber, wie Erklärungen von "Erklär die Daten" analysiert und evaluiert werden, finden Sie unter Funktionsweise von "Erklär die Daten".

Erkunden von zugrunde liegenden Werten

In diesem Abschnitt sind für jede erklärbare Kennzahl (die als Zielkennzahlen bezeichnet werden) Erklärungen angegeben. Jede hier aufgeführte Erklärung beschreibt eine Beziehung zu den Werten der Zielkennzahl, die an der analysierten Markierung getestet sind. Ob die von "Erklär die Daten" gefundenen Beziehungen aussagekräftig sind und es sich lohnt, sie näher zu untersuchen, müssen Sie nach Ihrem eigenen praktischen Sachverstand entscheiden.

In diesem Beispiel ist "Fahrstrecke" (Trip Distance) die Zielkennzahl.

Zugrunde liegende Merkmale

Diese Erklärungen beschreiben, welchen Beitrag Datensätze, die den Markierungen in der Ansicht zugrunde liegen, zu dem aggregierten Wert der erklärten Kennzahl leisten. Zu Markierungsattributen können Extremwerte, NULL-Werte, Anzahl der Datensätze oder der Durchschnittswert der Markierung gehören.

Hinweis: Definitionen von Begriffen, die in Erklärungen häufig verwendet werden, finden Sie unter Begriffe und Konzepte in Erklärungen(Link wird in neuem Fenster geöffnet).

Extremwerte

Erklärungen dieser Art zeigen an, ob ein oder mehrere Datensätze über Werte verfügen, die deutlich höher oder niedriger sind als die der meisten Datensätze. Wenn die Erklärung von einem Modell gestützt wird, weist das darauf hin, dass der Extremwert Auswirkungen auf die Zielkennzahl der analysierten Markierung hat.

Wenn eine Markierung über Extremwerte verfügt, bedeutet das nicht automatisch, dass es sich um Ausreißer handelt oder dass Sie deren Datensätze von der Ansicht ausschließen sollten. Diese Wahl liegt – abhängig von Ihrer Analyse – ganz bei Ihnen. Die Erklärung selbst weist einfach nur auf einen Extremwert in der Markierung hin. Zum Beispiel könnte ein falsch geschriebener Wert in einem Datensatz aufgedeckt werden, bei dem eine Banane 10 Dollar anstatt 10 Cent kostet. Oder es könnte sich herausstellen, dass ein bestimmter Verkäufer ein hervorragendes Quartal hatte.

Hinweis: Diese Erklärung muss vom Autor aktiviert werden, damit sie im Ansichtsmodus einer veröffentlichten Arbeitsmappe sichtbar ist. Weitere Informationen finden Sie unter Steuern des Zugriffs auf "Erklär die Daten".

Diese Erklärung zeigt Folgendes an:

  • Die Anzahl der zugrunde liegenden Datensätze in der analysierten Markierung.
  • Der oder die Extremwerte, die einen Beitrag zu dem Wert der Zielkennzahl leisten
  • Die Verteilung von Werten in der Markierung
  • Details zu den Datensätzen, die zu den einzelnen Verteilungswerten gehören

Möglichkeiten für nähere Untersuchungen:

  • Bewegen Sie den Mauszeiger über einen Kreis im Diagramm, um den zugehörigen Wert anzuzeigen.
  • Klicken Sie auf den Links- oder Rechtspfeil unterhalb der Detailliste, um durch die Datensatzdetails zu blättern.
  • Falls vorhanden, klicken Sie auf Vollständige Daten anzeigen und dann auf die Registerkarte Vollständige Daten, um alle Datensätze in einer Tabelle anzuzeigen.
  • Wählen Sie das Symbol zum Öffnen , um eine größere Version der Visualisierung anzuzeigen.

Nächste Schritte zur Analyse:

  • Wenn die Anzahl der Datensätze gering ist, überprüfen Sie diese Werte im Vergleich zum Extremwert.
  • Wenn der Extremwert deutlich höher oder niedriger ist als die anderer Werte des Datensatzes, schließen Sie ihn aus und beobachten Sie, wie sich der Wert der analysierten Markierung ändert.
  • Wenn Sie die Daten mit und ohne Extremwert betrachten, sehen Sie dies als eine Gelegenheit an, Ihr praktisches Wissen über die Daten anzuwenden.

 

In diesem Beispiel sorgt ein einzelner Extremwert von 463 Mietstunden dafür, dass die Gesamtmietzeit mit 613 Stunden höher als erwartet ausfällt.

Ein wahrscheinlicher Grund für diesen hohen Wert könnte sein, dass jemand bei der Rückgabe vergessen hat, das Fahrrad anzudocken. In solch einem Fall würde der Autor diesen Wert möglicherweise für zukünftige Analysen ausschließen.

 

Visualisierung des Unterschieds

Dieser Abschnitt zeigt:

  • Wie sich der Wert einer analysierten Markierung ändert, wenn der Extremwert ausgeschlossen wird.

 

 

 

 

 

 

 

Möglichkeiten für nähere Untersuchungen:

  • Wählen Sie das Symbol zum Öffnen , um eine größere Version der Visualisierung anzuzeigen.
  • Untersuchen Sie den Unterschied mit und ohne den bzw. die Extremwerte.
  • Autoren können die Ansicht als ein neues Blatt öffnen und einen Filter anwenden, um den Extremwert auszuschließen.

Nächste Schritte zur Analyse:

  • Wenn der Extremwert deutlich höher oder niedriger ist als die anderer Werte des Datensatzes, schließen Sie ihn aus und beobachten Sie, wie sich der Wert der analysierten Markierung ändert.
  • Wenn Sie die Daten mit und ohne Extremwert betrachten, sehen Sie dies als eine Gelegenheit an, Ihr praktisches Wissen über die Daten anzuwenden.
 

Wenn in diesem Beispiel der Extremwert "483" ausgeschlossen wird, liegt die analysierte Markierung – im Vergleich zu anderen Markierungen in der Ansicht – nicht mehr so hoch. Jetzt fallen andere Markierungen auf. Der Autor könnte nun die anderen Markierungen untersuchen, um festzustellen, warum diese anderen Standorte höhere Stundenzahlen für den Fahrradverleih haben.

Nullwerte

Die Erklärungsart "NULL-Werte" weist auf Situationen hin, in denen mehr Daten in einer Markierung fehlen als erwartet. Sie gibt an, wie hoch der Anteil der NULL-Werte an den Zielkennzahlen ist und wie die NULL-Werte zum aggregierten Wert der jeweiligen Kennzahl beitragen können.

Diese Erklärung zeigt Folgendes an:

  • Der prozentuale Anteil der Werte, die in der Zielkennzahl für die analysierte Markierung (blauer Kreis) NULL sind.

Möglichkeiten für nähere Untersuchungen:

  • Bewegen Sie den Mauszeiger über die einzelnen Kreise im Streudiagramm, um die Details anzuzeigen.
  • Scrollen Sie, um mehr vom Diagramm anzuzeigen.
  • Wählen Sie das Symbol zum Öffnen , um eine größere Version der Visualisierung anzuzeigen.

Nächste Schritte zur Analyse:

  • Optional können Sie NULL-Werte in der Markierung von der weiteren Analyse ausschließen.
 

In diesem Beispiel wird der Prozentsatz der NULL-Werte in der Zielkennzahl als blauer Kreis dargestellt.

Anzahl von Datensätzen

Diese Erklärungsart beschreibt, wenn die Anzahl der zugrunde liegenden Datensätze mit der Summe korreliert. Die Analyse ist auf einen Zusammenhang zwischen der Anzahl der in einer Markierung aggregierten Datensätze und dem tatsächlichen Wert der Markierung gestoßen.

Obwohl dies offensichtlich erscheinen mag, hilft Ihnen diese Erklärungsart herauszufinden, ob der Wert der Markierung von der Höhe der Werte in den Datensätzen oder einfach nur von der Anzahl der Datensätze in der analysierten Markierung beeinflusst wird.

Diese Erklärung zeigt Folgendes an:

  • Die Anzahl der Datensätze in der Zielkennzahl für die analysierte Markierung (dunkelblauer Balken).
  • Die Anzahl der Datensätze in der Zielkennzahl für andere Markierungen in der Quellvisualisierung (hellblauer Balken).

Möglichkeiten für nähere Untersuchungen:

  • Halten Sie den Mauszeiger über die einzelnen Balken, um deren Details anzuzeigen.
  • Scrollen Sie, um mehr vom Diagramm anzuzeigen.
  • Wählen Sie das Symbol zum Öffnen , um eine größere Version der Visualisierung anzuzeigen.

Nächste Schritte zur Analyse:

  • Vergleichen Sie, ob die einzelnen Werte von Datensätzen niedrig oder hoch sind oder ob die Anzahl der Datensätze in der analysierten Markierung niedrig oder hoch ist.
  • Wenn Sie als Autor von einer hohen Anzahl von Datensätzen überrascht sind, müssen Sie die Daten möglicherweise normalisieren.
 

In diesem Beispiel wird die Anzahl der Datensätze für die Fahrstrecke für jeden Wert von Fahrmonat aufgelistet, der eine Dimension in der ursprünglichen Visualisierung ist. Für den August ist der höchste Gesamtwert für die Fahrstrecke verzeichnet.

Sie können nun untersuchen, ob der August den höchsten Wert für die Fahrstrecke hat, weil im August mehr Fahrten stattgefunden haben oder weil einige Fahrten länger waren.

Durchschnittswert der Markierung

Diese Erklärungsart beschreibt, wenn der Durchschnitt einer Kennzahl mit der Summe korreliert. Vergleichen Sie, ob der Durchschnittswert niedrig oder hoch ist oder ob die Anzahl der Datensätze niedrig oder hoch ist.

Diese Erklärung zeigt Folgendes an:

  • Der Durchschnitt der Zielkennzahl für jeden Wert einer Dimension, der in der Quellvisualisierung verwendet wird.

Möglichkeiten für nähere Untersuchungen:

  • Halten Sie den Mauszeiger über die einzelnen Balken, um deren Details anzuzeigen.
  • Scrollen Sie, um mehr vom Diagramm anzuzeigen.
  • Wählen Sie das Symbol zum Öffnen , um eine größere Version der Visualisierung anzuzeigen.

Nächste Schritte zur Analyse:

  • Vergleichen Sie, ob der Durchschnittswert niedrig oder hoch ist oder ob die Anzahl der Datensätze niedrig oder hoch ist. Sind die Gewinne beispielsweise hoch, weil Sie viele Artikel verkauft haben oder weil Sie teure Artikel verkauft haben?
  • Versuchen Sie herauszufinden, warum die erklärte Markierung über einen deutlich höheren oder niedrigeren Durchschnittswert verfügt.

 

 

In diesem Beispiel liegt die durchschnittliche Fahrstrecke für August nicht wesentlich höher oder niedriger als in den meisten Monaten. Dies deutet darauf hin, dass die Fahrstrecke im August ausfiel, weil mehr Fahrten stattgefunden haben, und nicht weil Kunden längere Fahrten unternommen haben.

 

Beitragender Einzelwert

Verwenden Sie diese Erklärung, um die Zusammensetzung der Datensatzwerte zu verstehen, aus denen die analysierte Markierung besteht.

Diese Erklärungsart zeigt an, wenn möglicherweise ein einzelner Wert in einer nicht visualisierten Dimension einen Beitrag zum Gesamtwert der analysierten Markierung leistet. Eine nicht visualisierte Dimension ist eine Dimension, die in der Datenquelle vorhanden ist, aber in der Ansicht gerade nicht verwendet wird.

Diese Erklärung zeigt an, wenn jeder einer Dimension zugrunde liegende Datensatz denselben Wert hat oder wenn ein Dimensionswert auffällt, weil entweder viele oder einige wenige Datensätze den gleichen Einzelwert für die analysierte Markierung haben.

Hinweis: Definitionen von Begriffen, die in Erklärungen häufig verwendet werden, finden Sie unter Begriffe und Konzepte in Erklärungen(Link wird in neuem Fenster geöffnet).

Diese Erklärung zeigt Folgendes an:
  • Der prozentuale Anteil der Anzahl von Datensätzen für einen einzelnen Wert einer Dimension für die analysierte Markierung (blauer Balken) im Vergleich zu allen Markierungen (grauer Balken) in der Quellvisualisierung.
  • Der prozentuale Anteil der Anzahl von Datensätzen für alle anderen Werte einer Dimension für die analysierte Markierung (blauer Balken) im Vergleich zu allen Markierungen (grauer Balken) in der Quellvisualisierung.
  • Der Durchschnitt der Zielkennzahl für den einzelnen Wert einer Dimension in der analysierten Markierung (blauer Balken) im Vergleich zu allen Markierungen (grauer Balken).
  • Der Durchschnitt der Zielkennzahl für alle anderen Werte einer Dimension für die analysierte Markierung (blauer Balken) im Vergleich zu allen Markierungen (grauer Balken) in der Quellvisualisierung.

Möglichkeiten für nähere Untersuchungen:

  • Halten Sie den Mauszeiger über die einzelnen Balken, um deren Details anzuzeigen.
  • Wählen Sie das Symbol zum Öffnen , um eine größere Version der Visualisierung anzuzeigen.

Nächste Schritte zur Analyse:

  • Verwenden Sie diese Erklärung, um die Zusammensetzung der Datensatzwerte zu verstehen, aus denen die analysierte Markierung besteht.
  • Autoren möchten vielleicht eine neue Visualisierung erstellen, um etwaige nicht visualisierte Dimensionen zu untersuchen, die in dieser Erklärung auftauchen.
 

In diesem Beispiel hat die statistische Analyse ergeben, dass viele der Fahrten aus der Gegend der Station "Back Bay" stammen. Beachten Sie, dass "Stationsgegend" eine nicht visualisierte Dimension ist, die laut den Daten, die der Quellvisualisierung zugrunde liegen, in einer gewissen Beziehung zur Fahrstrecke steht.

 

stärkste Faktoren

Verwenden Sie diese Erklärung, um die Werte anzuzeigen, die den größten Teil der analysierten Marke ausmachen.

Bei einer COUNT-Aggregation zeigt "Wichtigste Beitragende" Dimensionswerte mit den meisten Datensätzen an. Bei SUM zeigt diese Erläuterung Dimensionswerte mit der größten Teilsumme an.

 

Beitragende Dimensionen

Verwenden Sie diese Erklärung, um die Zusammensetzung der Datensatzwerte zu verstehen, aus denen die analysierte Markierung besteht.

Diese Erklärungsart zeigt, dass die Verteilung einer nicht visualisierten Dimension möglicherweise einen Beitrag zum aggregierten Wert der analysierten Markierung leistet. Diese Art von Erklärung wird für Summen, Zählerstände und Durchschnitte von Zielkennzahlen verwendet. Eine nicht visualisierte Dimension ist eine Dimension, die in der Datenquelle vorhanden ist, aber in der Ansicht gerade nicht verwendet wird.

Hinweis: Definitionen von Begriffen, die in Erklärungen häufig verwendet werden, finden Sie unter Begriffe und Konzepte in Erklärungen(Link wird in neuem Fenster geöffnet).

Diese Erklärung zeigt Folgendes an:
  • Der prozentuale Anteil von Datensätzen für alle Werte einer Dimension für die analysierte Markierung (blauer Balken) im Vergleich zu allen Werten einer Dimension für alle Markierungen (grauer Balken) in der Quellvisualisierung.
  • Der Durchschnitt der Zielkennzahl für alle Werte einer Dimension für die analysierte Markierung (blauer Balken) im Vergleich zu allen Werten einer Dimension für alle Markierungen (grauer Balken).

Möglichkeiten für nähere Untersuchungen:

  • Halten Sie den Mauszeiger über die einzelnen Balken, um deren Details anzuzeigen.
  • Scrollen Sie, um mehr vom Diagramm anzuzeigen.
  • Wählen Sie das Symbol zum Öffnen , um eine größere Version der Visualisierung anzuzeigen.

Nächste Schritte zur Analyse:

  • Verwenden Sie diese Erklärung, um die Zusammensetzung der Datensatzwerte zu verstehen, aus denen die analysierte Markierung besteht.
  • Autoren möchten vielleicht eine neue Visualisierung erstellen, um etwaige nicht visualisierte Dimensionen zu untersuchen, die in dieser Erklärung auftauchen.
 

In diesem Beispiel hat die statistische Analyse ergeben, dass mehr Fahrten von South Station und MIT und weniger Fahrten von Charles Circle und Kendall aus unternommen wurden, verglichen mit Fahrten, die insgesamt für Markierungen unternommen wurden.

Beachten Sie, dass "Stationsname" eine nicht visualisierte Dimension ist, die laut den Daten, die der Quellvisualisierung zugrunde liegen, in einer gewissen Beziehung zur Fahrstrecke steht.

 

Beitragende Kennzahlen

Diese Erklärungsart zeigt, dass der Durchschnitt einer nicht visualisierten Kennzahl möglicherweise einen Beitrag zum aggregrierten Wert der analysierten Markierung leistet. Eine nicht visualisierte Kennzahl ist eine Kennzahl, die in der Datenquelle vorhanden ist, aber in der Ansicht gerade nicht verwendet wird.

Diese Erklärung kann eine lineare oder quadratische Beziehung zwischen der nicht visualisierten Kennzahl und der Zielkennzahl aufdecken.

Hinweis: Definitionen von Begriffen, die in Erklärungen häufig verwendet werden, finden Sie unter Begriffe und Konzepte in Erklärungen(Link wird in neuem Fenster geöffnet).

Diese Erklärung zeigt Folgendes an:
  • Die Beziehung zwischen der Summe der Zielkennzahl und dem Durchschnitt einer nicht visualisierten Kennzahl für die analysierte Markierung (blauer Kreis) und alle Markierungen (graue Kreise) in der Ansicht.
  • Wenn die Summe der Zielkennzahl hoch oder niedrig ist, weil der Durchschnittswert der nicht visualisierten Kennzahl hoch oder niedrig ist.

Möglichkeiten für nähere Untersuchungen:

  • Halten Sie den Mauszeiger über die einzelnen Kreise, um deren Details anzuzeigen.
  • Wählen Sie das Symbol zum Öffnen , um eine größere Version der Visualisierung anzuzeigen.

Nächste Schritte zur Analyse:

  • Autoren möchten vielleicht eine neue Visualisierung erstellen, um etwaige nicht visualisierte Kennzahlen zu untersuchen, die in dieser Erklärung aufgetaucht sind.
 

In diesem Beispiel wäre ein möglicher Grund für die hohe Fahrstrecke, dass auch die durchschnittliche Gesamtmietzeit hoch ist.

Weitere zu untersuchende Dinge

Dieser Abschnitt gibt mögliche Gründe dafür an, warum die analysierte Markierung einmalig oder unüblich ist. Diese Erklärungen:

  • Erklären nicht, warum der Wert dieser Markierung so ist, wie er ist.
  • Stehen in keinem Zusammenhang mit dem Wert der Kennzahlen in der Quellvisualisierung.
  • Berücksichtigen keinerlei Zielkennzahlen.

Weitere interessante Dimensionen

Verwenden Sie diese Erklärung, um die Zusammensetzung der Datensatzwerte zu verstehen, aus denen die analysierte Markierung besteht.

Die Verteilung einer nicht visualisierten Dimension in der analysierten Markierung ist im Vergleich zur Verteilung der Werte für alle anderen Markierungen in der Ansicht ungewöhnlich. Eine nicht visualisierte Dimension ist eine Dimension, die in der Datenquelle vorhanden ist, aber in der Ansicht gerade nicht verwendet wird.

Hinweis: Definitionen von Begriffen, die in Erklärungen häufig verwendet werden, finden Sie unter Begriffe und Konzepte in Erklärungen(Link wird in neuem Fenster geöffnet).

Diese Erklärung zeigt Folgendes an:
  • Der prozentuale Anteil von Datensätzen für alle Werte einer Dimension für die analysierte Markierung (blauer Balken) im Vergleich zu allen Werten einer Dimension für alle Markierungen (grauer Balken) in der Quellvisualisierung.

Möglichkeiten für nähere Untersuchungen:

  • Halten Sie den Mauszeiger über die einzelnen Balken, um deren Details anzuzeigen.
  • Scrollen Sie, um mehr vom Diagramm anzuzeigen.
  • Wählen Sie das Symbol zum Öffnen , um eine größere Version der Visualisierung anzuzeigen.

Nächste Schritte zur Analyse:

  • Verwenden Sie diese Erklärung, um die Zusammensetzung der Datensatzwerte zu verstehen, aus denen die analysierte Markierung besteht.
  • Autoren möchten vielleicht eine neue Visualisierung erstellen, um etwaige nicht visualisierte Dimensionen zu untersuchen, die in dieser Erklärung auftauchen.
 

In diesem Beispiel steht ein hoher prozentualer Anteil von Datensätzen mit bewölktem Wetter im Zusammenhang. Da es sich bei den Daten um Fahrradverleihvorgänge in Boston handelt und die analysierte Markierung die Fahrstrecke für August ist, können wir davon ausgehen, dass das Wetter normalerweise warm und feucht ist. An bewölkten Tagen hätten die Leute vielleicht öfter Fahrräder gemietet, um die Hitze zu vermeiden. Es ist auch möglich, dass es im August mehr bewölkte Tage gab.

 

Vielen Dank für Ihr Feedback!Ihr Feedback wurde erfolgreich übermittelt. Vielen Dank.