Konfigurieren der Tableau-Einstellungen für Datenstorys: Analysen

Innerhalb Ihrer Tableau-Datenstory können Sie auswählen, über welche Analysen geschrieben werden soll und zu welchem Zeitpunkt dies erfolgen soll. Je nach dem, von welchem Typ Ihre Story ist und wie viele Dimensionen und Kennzahlen Ihre Story enthält, stehen verschiedene Typen von Analysen zur Verfügung. Allerdings werden Analysen für Storys vom Typ "Streudiagramm" derzeit nicht unterstützt. Weitere Informationen finden Sie unter Auswahl des richtigen Storytyps für Ihre Tableau-Datenstory.

Konfigurieren von Analysen für Ihre Story

  1. Hinzufügen einer Datenstory zu einem Dashboard.
  2. Klicken Sie in Ihrem Dashboard auf das Symbol für Einstellungen in der oberen linken Ecke Ihres Datenstory-Objekts.
  3. Klicken Sie im Dialogfeld "Datenstory" auf die Registerkarte Analysen.
  4. Klicken Sie auf die Schalter zum Aktivieren der verschiedene Typen von Analysen.
  5. Erweitern Sie für Segmente und Trendlinie die Option Einstellungen, um Schwellenwerte für die Durchführung dieser Analysen festzulegen.
  6. Klicken Sie auf Speichern.

Grundlegendes zu den verschiedenen Typen von Analysen

Korrelation

Verwenden Sie Korrelation, um echte statistische Zusammenhänge zwischen zwei Datenreihen zu identifizieren. Wenn Sie mehr als zwei Reihen haben, werden alle Kombinationen auf Korrelationen analysiert. So können Sie Korrelation zum Beispiel aktivieren, um festzustellen, wann zwei Produkte häufig zusammen gekauft werden.

Clustering

Verwenden Sie Clustering, um individuelle Gruppen von Datenpunkten (Cluster) mithilfe einer einzigen statistischen Analyse zu identifizieren. So können Sie Clustering zum Beispiel aktivieren, um festzustellen, wann ein Produkt in einer bestimmten geografischen Region sehr beliebt ist.

Verteilung

Verwenden Sie Verteilung, um Datenpunkte anhand nichtstatistischer Beobachtungen (wie Mittelwert, Median, Schiefe usw.) relativ zueinander einzustufen. So können Sie Verteilung zum Beispiel aktivieren, um zu ermitteln, welches Produkt die höchste Gewinnquote aufweist.

Segmente

Verwenden Sie Segmente, um auffallende Änderungen an Datenpunkten innerhalb einer Datenreihe hervorzuheben. Legen Sie zuerst fest, wie hoch eine Änderung in einem Segment mindestens sein soll (in Prozent), damit über sie geschrieben wird. Änderungen, die unter den von Ihnen definierten Schwellenwert fallen, werden nicht erwähnt. Wenn Sie beispielsweise Ihren Segmentschwellenwert auf Änderungen von mehr als 60 % festlegen, werden Stellen mit einem Rückgang von 30 % in Ihrer Story nicht erwähnt.

Nachdem Sie Ihren Schwellenwert festgelegt haben, wählen Sie aus, ob Sie eine Formatierung anwenden möchten, und legen Sie den Mindestprozentsatz an Veränderung fest, der formatiert werden soll.

Trendlinie

Verwenden Sie Trendlinie, um eine lineare Ausgleichsgerade ("Best Fit Line", BFL) zu berechnen und Daten zu identifizieren, die innerhalb eines definierten Prozentsatzes an Konfidenz liegen. Daten mit einer hohen Variabilität haben eine niedrigere Aussagewahrscheinlichkeit als Daten, die konsistenter sind, und diese Aussagewahrscheinlichkeit wirkt sich darauf aus, ob über Trendlinien geschrieben wird. Sie können Trendlinien für Storys verwenden, die eine Dimension und eine Kennzahl haben, oder Sie können Trendlinien in einem Drilldown verwenden. Weitere Informationen zu Drilldowns finden Sie unter Konfigurieren der Tableau-Einstellungen für Datengeschichten: Narrativ.

Legen Sie den Mindestprozentsatz an Konfidenz für Ihre Trendlinie fest. Wenn Sie Ihren Schwellenwert auf 95 % festlegen, eine Trendlinie jedoch bei 90 % Konfidenz gezogen werden könnte, schreibt Ihre Story nicht über Trendlinien. Nachdem Sie Ihren Schwellenwert festgelegt haben, wählen Sie, ob Sie eine Formatierung anwenden möchten. Dann legen Sie den Mindestprozentsatz an Veränderung fest, der formatiert werden soll.

Tableau-Datenstorys über Trendlinien kommunizieren die absolute Veränderung über einen bestimmten Zeitraum. Die Story, die über Ihre Trendlinie geschrieben wird, variiert je nach dem Ausmaß an Ausführlichkeit, das Sie für Ihre Story festgelegt haben. Wenn Ihre Story eine hohe Ausführlichkeit verwendet, schreibt Ihre Story über das Bestimmtheitsmaß (das ist ein statistisches Konzept, das quantifiziert, wie gut Ihre Daten zu der Trendlinie passen). Weitere Informationen zu Ausführlichkeitseinstellungen finden Sie unter Konfigurieren der Tableau-Einstellungen für Datengeschichten: Narrativ.

In den Einstellungen für Trendlinie können Sie auch auswählen, für wie viele Zeiträume in die Zukunft Ihre Story Vorhersagen abgeben soll. Wenn Sie Vorhersagen verwenden, verwendet Ihre Story die Steigung und den Schnittpunkt der Trendlinie, um vorhergesagte Werte für zukünftige Zeiträume zu berechnen. Die Konfidenz der Vorhersage fügt dem Konfidenzschwellenwert, den Sie für Trendlinien festgelegt haben, Ober- und Untergrenzen hinzu. Sie können Vorhersagen verwenden, wenn Ihre Story mindestens 30 Datenpunkte enthält, die linear sind.

Volatilität

Verwenden Sie Volatilität, um Standardabweichungen im zeitlichen Verlauf zu analysieren. So können Sie Volatilität zum Beispiel verwenden, wenn Ihre Story über Werte schreiben soll, die außerhalb des durchschnittlichen Bereichs für Ihre Daten liegen.

Aufschlüsselung, wie Analysen verwendet werden, um Storys zu generieren

An dieser Stelle fragen Sie sich vielleicht, wie die Analysen bei verschiedenen Story-Typen funktionieren. Sehen wir uns ein Beispiel für jeden Typ von Story an und schlüsseln jeden Satz in der Story auf.

Grundlegendes zu Analysen für Storys vom Typ "Einzeln"

Da fortlaufende Storys Trends im zeitlichen Verlauf messen, schreibt Datenstorys über Leistung, Progression, Durchschnitte, Gesamtwerte, Streifen, Volatilität, Segmente und Vorhersagen.

Das folgende Beispiel einer fortlaufenden Story handelt von Umsätzen pro Monat:

Eine Beispiel-Story mit in Textform formulierten Einblicken zu Umsätzen pro Monat. Der Text in diesem Bild ist in der folgenden Tabelle transkribiert.

Beispiel-StoryAufschlüsselung der Story
  • Der durchschnittliche Umsatz lag über alle 48 Monate bei 47.858 $.
  • Der Mindestwert betrug 4.520 $ (Februar 2014) und der Höchstwert 118.448 $ (November 2017).
Die ersten beiden Sätze verwenden Durchschnitts- und Bereichsfunktionen, um über die durchschnittlichen, maximalen und minimalen Werte in dem von Ihnen analysierten Zeitraum zu schreiben.
  • Die Verkäufe nahmen im Laufe der Serie um 489 % zu, endeten jedoch mit einem Abwärtstrend und gingen im letzten Monat zurück.
Im dritten Satz geht es um die Gesamtleistung der Kennzahl über den Zeitraum. So kann es in einem Satz beispielsweise darum gehen, ob der Umsatz in einem bestimmten Zeitraum gestiegen, gesunken oder anders verlaufen ist.
  • Der prozentual größte Einzelanstieg erfolgte im März 2014 (+1.132 %). Der größte Einzelanstieg auf absoluter Basis erfolgte dagegen im September 2014 (+53.868 $).
Der vierte Satz verwendet die Progressionsanalyse. Dieser Satz beschreibt den größten Anstieg und Rückgang basierend auf der Kennzahl während des Zeitraums sowohl auf einer prozentualen als auch auf einer absoluten Basis.
  • Von den drei Reihen bestand die stärkste Beziehung zwischen Corporate und Home Office, die eine mäßige positive Korrelation aufwies, was darauf hindeutet, dass mit zunehmendem Wert der einen (Corporate) für gewöhnlich auch die andere (Home Office) zunimmt (oder umgekehrt).
Dieser Satz liefert eine Erkenntnis vom Typ Korrelation. Dieser Typ von analytischer Erkenntnis schreibt über nennenswerte Korrelationen zwischen verschiedenen Reihen in Ihren Daten.
  • Die Umsätze erfolgten zyklisch, wobei sich jeder Zyklus etwa alle 12 Monate wiederholte. Außerdem gab es auch ein Muster kleinerer Zyklen, das sich etwa alle drei Monate wiederholte.
  • Der Umsatz hatte einen signifikanten positiven Höhepunkt zwischen Oktober 2014 (31.453 $) und Februar 2015 (11.951 $), und stieg im November 2014 bis auf 78.629 $ an.
Dieser Satz liefert eine Erkenntnis vom Typ Segment. Dieser Typ von analytischer Erkenntnis schreibt über nennenswerte Zu- und Abnahmen im zeitlichen Verlauf.
  • Der lineare Gesamttrend der Datenreihe stieg auf 902 $ pro Monat, was einer absoluten Veränderung von 42.394 $ im Verlauf der Reihe entspricht. Wenn sich dieser Trend für den nächsten Monat fortsetzt, wird der Umsatz voraussichtlich bei etwa 69.958 $ liegen.
Dieser Satz liefert eine Erkenntnis vom Typ Trendlinie. Dieser Typ von Erkenntnissen beschreibt, wie gut Trends mit einem bestimmten Prozentsatz an Vertrauen zu Ihren Daten passen, und Trendlinien ermöglichen es Ihnen, Vorhersagen auf der Grundlage historischer Trends zu treffen.

Grundlegendes zu Analysen für Storys vom Typ "Einzeln"

Da Einzelstorys es Ihnen ermöglichen, Werte zu vergleichen und die Verteilung der Daten zu verstehen, schreibt die Story über Verteilung, Durchschnitte, Gesamtwerte und Gruppierungen oder Cluster über die Daten.

Das folgende Beispiel einer Einzelstory handelt von Umsätzen nach Produkt:

Eine Beispiel-Story mit in Textform formulierten Einblicken zu Umsätzen nach dem Produkt. Der Text in diesem Bild ist in der folgenden Tabelle transkribiert.

Beispiel-StoryAufschlüsselung der Story
  • Der Gesamtumsatz beträgt 2,3 Millionen US-Dollar für alle 17 Produkte.
Der erste Satz berechnet den Gesamtwert Ihrer Kennzahl.
  • Von dem Umsatz in Höhe von 2,3 Millionen US-Dollar entfielen auf Telefone 330.007 $, Stühle 328.449 $ und Speicher 223.844 $.
Der zweite Satz schreibt über die Dimensionstreiber. In diesem Beispiel sind die Dimensionstreiber die Produkte, die am meisten zum Gesamtumsatz beigetragen haben.
  • Die Verteilung ist positiv verzerrt, da der Durchschnitt von 135.129 $ größer ist als der Median von 114.880 $.
  • Der Umsatz ist relativ konzentriert, wobei 78 % des Gesamtumsatzes auf acht der 17 Produkte entfallen (47 %).
Der dritte und der vierte Satz analysieren die Verteilung der Daten. Dies analysiert die Durchschnittswerte, Mediane, Konzentration von Daten (sofern vorhanden) und wie die Daten verzerrt sind. Das hilft zu erkennen, wie ausgewogen diese gruppierten Variablen miteinander verglichen werden.
  • Die beiden Spitzenprodukte machen zusammen über ein Viertel (29 %) des Gesamtumsatzes aus.
Dieser Satz verwendet Clustering, um über Kennzahlen zu schreiben, die gruppiert werden können. Dies hilft zu erkennen, ob es bestimmte Gruppen gibt, die sich in den Daten abheben.
  • Telefone liegen mit 330.007 $ mehr als doppelt so hoch wie der Durchschnitt der 17 Produkte.
Der letzte Satz schreibt über bemerkenswerte Ausreißer.

Grundlegendes zu Analysen für Storys vom Typ "Streudiagramm"

Storys vom Typ "Streudiagramm" werden am besten dafür eingesetzt, um die Beziehung zwischen zwei Kennzahlen zu verstehen. Aus diesem Grund sind für Streudiagramm-Storys auch 2 bis 3 Kennzahlen erforderlich. Die Streudiagrammanalyse schreibt über die Beziehung (Regression) zwischen zwei Kennzahlen und über Gruppen (Cluster) innerhalb der Daten, sofern vorhanden.

Das folgende Beispiel einer Streudiagramm-Story handelt von Gewinn und Umsatz über eine Dimension hinweg:

Eine Beispiel-Story mit in Textform formulierten Einblicken zu Gewinn und Umsatz. Der Text in diesem Bild ist in der folgenden Tabelle transkribiert.

Beispiel-StoryAufschlüsselung der Story
  • Mit zunehmender Stückzahl und zunehmendem Gewinn hat auch der Umsatz laut den bereitgestellten Daten zugenommen. Genauer gesagt, wenn sich die Stückzahl um 1 erhöhte, nahm der Umsatz um 49,55 $ zu, und wenn der Gewinn um 1,00 $ stieg, nahm der Umsatz um 1,20 $ zu.
  • Nur wenige Kunden wichen von dieser allgemeinen Beziehung ab, was auf eine gute Passung der Daten hinweist.
Die ersten beiden Sätze basieren auf Regressionsanalysen. Die Regression zeigt, wie sich eine Kennzahl auf eine andere auswirkt. Beachten Sie, dass die Story im ersten Satz eine Beziehung zwischen Gewinn und Umsatz identifiziert hat.
  • Wenn die Daten in Gruppen mit ähnlichen Gewinn-, Mengen- und Umsatzwerten organisiert werden, sticht eine bestimmte Gruppe hervor. Es gab 651 Kunden, bei denen die Werte für den Gewinn zwischen -6.626 $ und 1.488 $, die Stückzahl zwischen und 122 und der Umsatz zwischen 4,83 $ und 5.690 $ lag.
Der dritte Satz ergibt sich aus dem Clustering. Die Clustering-Analyse versucht, Schlüsselgruppen oder -Cluster über alle Variablen in den Daten hinweg zu identifizieren.
  • Tamara Chand, Raymond Buchund Sanjit Chandgehörten mit hohen Gewinn- und Umsatzwerten zu den Ausreißern. Sean Miller fiel durch einen niedrigen Gewinn und einen hohen Verkaufswert auf.
Im vierten Satz geht es um Ausreißer – also Werte, die deutlich über oder unter dem Durchschnitt liegen.
  • Der Mindestwert beim Gewinn beträgt -6.626 $ (Cindy Steward) und der Höchstwert 8.981 $ (Tamara Chand), was einen Unterschied in Höhe von 15.608 $ ausmacht. Der durchschnittliche Gewinn pro Kunde beträgt 361 $ und der Median 228 $.
  • Der Mindestwert für die Stückzahl beträgt 2 (Anthony O’Donnell) und der Höchstwert 150 (Jonathan Doherty), was einen Unterschied in Höhe von 148 $ ausmacht. Die durchschnittliche Stückzahl pro Kunde liegt bei 47,76 und der Median beträgt 44.
  • Die Verteilung der Verkäufe reicht von 4,83 $ (Thai Sissman) bis zu 25.043 $ (Sean Miller), was einen Unterschied in Höhe von 25.038 $ ausmacht. Der durchschnittliche Umsatz pro Kunde beträgt 2.897 $ und der Median liegt bei 2.256 $.
Die restlichen Sätze für Streudiagramm-Storys verwenden Bereichs- und Durchschnittsanalysen, um Erkenntnisse zu schreiben.

Grundlegendes zu Analysen für Storys vom Typ "Prozent vom Ganzen"

Storys vom Typ "Prozent vom Ganzen" eignen sich am besten, um zu verstehen, welchen Teil eines Ganzen eine Dimension oder Kennzahl darstellt.

Das folgende Beispiel einer Story vom Typ "Prozent vom Ganzen" handelt vom Umsatz pro Segment:

Eine Beispiel-Story mit in Textform formulierten Einblicken zum Umsatz pro Segment. Der Text in diesem Bild ist in der folgenden Tabelle transkribiert.

Beispiel-StoryAufschlüsselung der Story
  • Die Gesamtsumme der Umsätze beträgt 2,3 Mill. US-Dollar für alle drei Geschäftsbereiche.

Der erste Satz berechnet den Gesamtwert Ihrer Kennzahl.
  • Von den 2,3 Mill. US-Dollar an Gesamtumsatz wurden 1,2 Millionen im Consumer-Bereich, 706.146 $ im Corporate-Bereich und 429.653 $ im Home Office-Bereich erzielt.

Der zweite Satz schreibt über so genannte "Treiber". In diesem Beispiel sind die Treiber die Segmente, die am meisten zum Gesamtumsatz beigetragen haben.
  • Der Mindestwert beträgt 429.653 $ (Home Office) und der Höchstwert 1,2 Millionen $ (Consumer), was eine Differenz von 731.748 $ ergibt (mit 765.734 $ im Durchschnitt).
Der letzte Satz analysiert die Verteilung der Daten.
Vielen Dank für Ihr Feedback!Ihr Feedback wurde erfolgreich übermittelt. Vielen Dank.