Analyse mit dem zweiten Datum in Tableau Desktop

Dies ist die zweite Stufe des Tutorials. Dabei wird davon ausgegangen, dass Sie die erste Stufe Auffinden des zweiten Datums mit Tableau Prep abgeschlossen haben.

In der ersten Stufe haben wir den Original-Datensatz geformt, um die Antworten auf die folgenden Fragen zu finden:

  1. Wie lang war die Zeitspanne in Tagen zwischen dem ersten und zweiten Verstoß für die einzelnen Fahrer?

  2. Vergleichen Sie die Bußgelder für die ersten und zweiten Verstöße. Besteht zwischen den Beträgen eine Korrelation?

  3. Welcher Fahrer hat insgesamt am meisten bezahlt? Wer hat am wenigsten bezahlt?

  4. Wie viele Fahrer haben mehrere Verstöße begangen?

  5. Wie hoch war das durchschnittliche Bußgeld für Fahrer, die nie die Verkehrsschule besucht haben?

Während wir diese Fragen untersuchen, wird deutlich, dass es für die von uns erstellte erste Datenstruktur Pro und Kontra gibt. Wir wechseln zu Tableau Prep Builder zurück und nehmen einige zusätzliche Umformungen vor. Anschließend untersuchen wir deren Auswirkungen auf dieselbe Analyse in Tableau Desktop. Schlussendlich betrachten wir einen reinen Tableau Desktop-Ansatz für die Analyse. Dabei verwenden wir Detailgenauigkeitsausdrücke (LOD) mit den Originaldaten.

Das Ziel dieses Tutorials besteht darin, verschiedene Konzepte im Kontext eines realen Szenarios vorzustellen und die unterschiedlichen Möglichkeiten durchzuspielen. Es geht nicht darum, die beste Möglichkeit festzustellen. Am Ende des Tutorials sollten Sie ein besseres Verständnis für die Auswirkungen der Datenstruktur auf die Berechnung und Analyse haben und besser mit den verschiedenen Aspekten von Tableau Prep und den Berechnungen in Tableau Desktop vertraut sein.

Hinweis: Für die Bearbeitung der Aufgaben in diesem Tutorial muss Tableau Prep Builder und optional Tableau Desktop installiert sein, und die Daten müssen heruntergeladen werden.

Bevor Sie mit diesem Tutorial fortfahren, schlagen Sie im Tableau Desktop- und Tableau Prep-Bereitstellungshandbuch(Link wird in neuem Fenster geöffnet) Informationen zum Installieren von Tableau Prep und Tableau Desktop nach. Andernfalls können Sie die kostenlosen Testversionen von Tableau Prep(Link wird in neuem Fenster geöffnet) und Tableau Desktop(Link wird in neuem Fenster geöffnet) herunterladen.

Der Datensatz wird aus der Datei Driver Infractions.tflx ausgegeben, die in der ersten Stufe erstellt wurde.

Analyse in Tableau Desktop

Da wir unsere Daten konfiguriert haben, verschieben wir sie nun nach Tableau Desktop. Einige Fragen lassen sich leicht beantworten, während für andere einige (oder umfassende) Berechnungen erforderlich sind. Versuchen Sie sich an den folgenden Fragen. Bei Problemen können Sie sie erweitern, um grundlegende Informationen zur weiteren Vorgehensweise zu erhalten.

Hinweis: Sie können die Arbeitsmappe Driver Infractions.twbx(Link wird in neuem Fenster geöffnet) herunterladen, um sich die Lösungen im Kontext anzusehen. Bedenken Sie, dass es Alternativen zum Interpretieren der Analyse oder Suchen nach Antworten geben kann.

1. Wie lang war die Zeitspanne in Tagen zwischen dem ersten und zweiten Verstoß für die einzelnen Fahrer?
2. Vergleichen Sie die Bußgelder für die ersten und zweiten Verstöße. Besteht zwischen den Beträgen eine Korrelation?
3. Welcher Fahrer hat insgesamt am meisten bezahlt? Wer hat am wenigsten bezahlt?
4. Wie viele Fahrer haben mehrere Verstöße begangen?
5. Wie hoch war das durchschnittliche Bußgeld für Fahrer, die nie die Verkehrsschule besucht haben?

Vertiefung – Pivotierte Daten

Obwohl die Daten, mit denen wir arbeiten, gut für die Beantwortung von Fragen zum ersten und zweiten Verstoß strukturiert sind, ist dies nicht die empfohlene Standardstruktur für Tableau Desktop. Je mehr unsere Analyse von grundlegenden Fragen zu den Datumsangaben der Verstöße abweicht, desto komplizierter werden unsere Berechnungen, um die relevanten Informationen in hilfreicher Form zu kombinieren.

Wenn Daten mit mehreren Spalten für denselben Datentyp gespeichert (z. B. zwei Spalten für Datum, zwei Spalten für Bußgeld usw.) und eindeutige Informationen im Feldnamen gespeichert werden (z. B. ob es sich um den ersten oder zweiten Verstoß handelt), ist dies in der Regel ein Indiz dafür, dass die Daten pivotiert werden sollten.

Eine mehrfache Pivotierung in Tableau Prep Builder eignet sich dafür sehr gut. Wir können das Ende des Tableau Prep-Schemas Fahrerverstoß, der im vorherigen Tutorial Auffinden des zweiten Datums mit Tableau Prep erstellt wurde, als Grundlage für unsere Arbeit verwenden.

Tipp: Stellen Sie sicher, dass Sie sich für die nächsten Schritte wieder in Tableau Prep befinden.

  1. Fügen Sie im letzten Bereinigungsschritt einen Schritt vom Typ Pivotieren hinzu, der für jedes duplizierte Feld eine Pivotierung vornimmt. Mithilfe des Plus-Symbols in der oberen rechten Ecke des Bereichs Pivotierte Felder können Sie weitere Pivotwerte hinzufügen. Alle Feldsätze (z. B. 1. und 2. Bußgeldbetrag) sollten zusammen pivotiert werden.

    Weitere Informationen zum Pivotieren finden Sie unter Bereinigen und Formen von Daten.

  2. Doppelklicken Sie im Bereich "Pivotierte Felder" unter der Spalte Pivot1-Namen auf die einzelnen Werte, und benennen Sie sie in 1. und 2. um.

    Konfigurationsbereich von Pivot 1 in Tableau Prep mit den fünf Pivots

Durch Entfernen der Null-Datumsangaben und durch Umbenennen und Neuanordnen der Felder können die Ergebnisse bereinigt werden.

  1. Fügen Sie nach der Pivotierung einen Bereinigungsschritt hinzu. Klicken Sie in der Spalte Datum des Verstoßes mit der rechten Maustaste auf die Null-Leiste, und wählen Sie Ausschließen aus.

  2. Doppelklicken Sie auf den Feldnamen Pivot1 Namen, und benennen Sie ihn um in Verstoßnummer.

  3. Ziehen Sie die Felder ggf., um sie wie unten gezeigt neu anzuordnen:

    Vorschau der pivotierten und bereinigten Daten

  1. Erstellen Sie in den neuen pivotierten Daten eine Ausgabe mit der Bezeichnung Pivotierte Fahrerverstöße, und verschieben Sie sie nach Tableau Desktop. (Vergessen Sie nicht, nach dem Hinzufügen des Schritts Ausgabe das Schema auszuführen.)

Mit dieser pivotierten Datenstruktur können wir uns nun erneut unsere fünf Fragen ansehen. Sie können bei Problemen alle Fragen erweitern, um grundlegende Informationen zur weiteren Vorgehensweise anzuzeigen.

Hinweis: Sie können die fertige Schemadatei Pivoted Driver Infractions.tflx herunterladen, um Ihre Arbeit zu prüfen. Sie können auch die Arbeitsmappe Pivoted Driver Infractions.twbx herunterladen, um sich die Lösungen im Kontext anzusehen. Bedenken Sie, dass es Alternativen zum Interpretieren der Analyse oder Suchen nach Antworten geben kann.

1. Wie lang war die Zeitspanne in Tagen zwischen dem ersten und zweiten Verstoß für die einzelnen Fahrer?
2. Vergleichen Sie die Bußgelder für die ersten und zweiten Verstöße. Besteht zwischen den Beträgen eine Korrelation?
3. Welcher Fahrer hat insgesamt am meisten bezahlt? Wer hat am wenigsten bezahlt?
4. Wie viele Fahrer haben mehrere Verstöße begangen?
5. Wie hoch war das durchschnittliche Bußgeld für Fahrer, die nie die Verkehrsschule besucht haben?

Vorteile von pivotierten Daten

Wenn wir wissen, dass wir lediglich Fragen beantworten müssen, auf die sich die Antwort mit dieser Struktur problemlos finden lässt, könnten wir die Original-Datenstruktur aus dem Tutorial beibehalten. Das pivotierte Datenformat ist jedoch flexibler. Obwohl dafür einige Berechnungen erforderlich sind, eignet sich der resultierende Datensatz nach deren Konfiguration gut, um erweiterte Fragestellungen zu beantworten.

Weitere Vertiefung – Nur Berechnungen

Wie verhält es sich, wenn Sie keinen Zugriff auf Tableau Prep Builder haben? Haben Sie schlichtweg Pech, wenn Sie nur die Originaldaten zur Verfügung haben? Keineswegs!

Mithilfe von Tableau Desktop und LOD-Ausdrücken lassen sich alle analytischen Fragestellungen beantworten. Wenn wir eine Verbindung zu der Originaldatei Traffic Violations.xlsx(Link wird in neuem Fenster geöffnet) herstellen, ähnelt dies stark dem pivotierten Datensatz – nur dass das wichtige Feld mit der Verstoßnummer fehlt. Daher müssen wir das Ergebnis der Aggregationsschritte über LOD-Ausdrücke imitieren.

Hinweis: Sie können die Arbeitsmappe LOD Driver Infractions.twbx(Link wird in neuem Fenster geöffnet) herunterladen, um sich die Lösungen im Kontext anzusehen. Bedenken Sie, dass es Alternativen zum Interpretieren der Analyse oder Suchen nach Antworten geben kann.

1. Wie lang war die Zeitspanne in Tagen zwischen dem ersten und zweiten Verstoß für die einzelnen Fahrer?
2. Vergleichen Sie die Bußgelder für die ersten und zweiten Verstöße. Besteht zwischen den Beträgen eine Korrelation?
3. Welcher Fahrer hat insgesamt am meisten bezahlt? Wer hat am wenigsten bezahlt?
4. Wie viele Fahrer haben mehrere Verstöße begangen?
5. Wie hoch war das durchschnittliche Bußgeld für Fahrer, die nie die Verkehrsschule besucht haben?

Denken Sie unbedingt daran, dass diese Lösung viele verschachtelte Berechnungen und LOD-Ausdrücke enthält. Je nach Größe des Datensatzes und Komplexität der Daten können Leistungsprobleme auftreten.

Reflexion der Methoden

Welchen Weg sollten Sie also einschlagen? Das hängt ganz von Ihnen und den Ihnen zur Verfügung stehenden Tools ab.

  • Wenn Sie auf LOD-Ausdrücke verzichten möchten, sollten Sie die Lösung der Datenformung wählen. Dabei können jedoch für einige Analysen Berechnungen erforderlich sein (Analyse in Tableau Desktop).

  • Wenn Sie die Daten formen können und mit Berechnungen, einschließlich LOD-Ausdrücken, vertraut sind, bietet eine Kombination aus beidem die größte Flexibilität (Vertiefung – Pivotierte Daten).

  • Wenn Sie sich mit LOD-Ausdrücken auskennen, die Leistung nur minimal beeinträchtigt wird und/oder Sie keinen Zugriff auf Tableau Prep haben, ist eine ausschließlich auf LOD-Ausdrücken basierende Lösung eine praktikable Option (Weitere Vertiefung – Nur Berechnungen).

Es ist zumindest nützlich, zu verstehen, wie die Aggregation in Tableau Prep und Detailgenauigkeitsausdrücke in Tableau Desktop miteinander zusammenhängen und inwiefern sie sich auf die Datenanalyse auswirken. Wie bei den meisten Dingen in Tableau gibt es für jede Aufgabe mehrere mögliche Ansätze. Untersuchen Sie alle Optionen, um die Konzepte zu kombinieren und die für Sie beste Lösung zu finden.

Verwendete Berechnungen:

Hinweis: Besonderer Dank geht an Ann Jackson, die in ihrem Blog "Workout Wednesday" der Frage Do Customers Spend More on Their First or Second Purchase?(Link wird in neuem Fenster geöffnet) (Geben Kunden beim ersten oder zweiten Einkauf mehr Geld aus?) nachgeht, und Andy Kriebel für den Tableau Prep-Tipp Returning the First and Second Purchase Dates(Link wird in neuem Fenster geöffnet) (Zurückgeben des Datums für den ersten und zweiten Kauf), auf denen die ursprüngliche Idee für dieses Tutorial beruht. Durch Klicken auf diese Links verlassen Sie die Tableau-Website. Tableau kann keine Verantwortung für die Richtigkeit oder Aktualität der von externen Anbietern unterhaltenen Seiten übernehmen. Bei Fragen zu den Inhalten wenden Sie sich direkt an den Besitzer der Website.