Erste Schritte in Tableau Prep Builder
Hinweis: Ab Version 2020.4.1 können Sie als Creator Schemata auch im Internet erstellen und bearbeiten. Dieses Tutorial wurde mit Tableau Prep Builder entwickelt, es kann aber auch im Internet mit einigen bekannten Ausnahmen durchgeführt werden.
In diesem Tutorial erhalten Sie eine Einführung in die allgemeinen Vorgänge, die in Tableau Prep verfügbar sind. Anhand der in Tableau Prep enthaltenen Beispieldatensätze werden Sie schrittweise ein Schema für einen Beispiel-Superstore erstellen. In diesem Tutorial wird die aktuellste Version von Tableau Prep Builder verwendet. Wenn Sie eine ältere Version verwenden, können Ihre Ergebnisse abweichen.
Achten Sie dabei auf die Tipps, um Einblicke darin zu erhalten, wie Tableau Prep Ihnen bei der Bereinigung und Formung Ihrer Daten für die Analyse hilft.
Bevor Sie mit diesem Tutorial fortfahren, müssen Sie Tableau Prep Builder installieren. Informationen hierzu finden Sie unter Installieren von Tableau Desktop oder Tableau Prep Builder über die Benutzeroberfläche(Link wird in neuem Fenster geöffnet) im Tableau Desktop- und Tableau Prep Builder-Bereitstellungshandbuch. Andernfalls können Sie die kostenlose Testversion(Link wird in neuem Fenster geöffnet) herunterladen.
Beispieldateien
Zum Ausführen der Aufgaben in diesem Tutorial müssen Sie Tableau Prep Builder installieren. Wenn die Webdokumenterstellung auf Ihrer Serverversion 2020.4 oder höher aktiviert ist, können Sie die Schritte auch im Internet ausführen.
Nach der Installation von Tableau Prep Builder auf Ihrem Computer finden Sie die Beispieldateien auch unter dem folgenden Verzeichnis:
- (Windows)
C:\Program Files\Tableau\Tableau Prep Builder <version>\help\Samples\en_US\Superstore Files
- (Mac)
/Applications/Tableau Prep Builder <version>.app/Contents/help/Samples/en_US/Superstore Files
Laden Sie die Beispieldateien alternativ über diese Links herunter, und erstellen Sie ein Verzeichnis "Samples" und das Unterverzeichnis "South". Sie müssen so vorgehen, wenn Sie dieses Tutorial im Internet durchführen.
Download in das Verzeichnis "Samples" | Download in das Unterverzeichnis "South" |
---|---|
Und das ist die Geschichte ...
Sie arbeiten in der Hauptniederlassung für eine große Einzelhandelskette. Ihr Chef möchte die Produktumsätze und Gewinne des Unternehmens für die letzten drei Jahre analysieren. Sie schlagen vor, dafür Tableau Desktop zu verwenden. Ihr Chef findet diese Idee großartig und möchte, dass Sie sich darum kümmern.
Während Sie alle benötigten Daten sammeln, bemerken Sie, dass die Daten für die einzelnen Regionen auf unterschiedliche Art und Weise erfasst und überwacht wurden. Zudem fällt Ihnen auf, dass die verschiedenen Dateien viele kreative Dateneingaben beinhalten und dass eine Region sogar über eine separate Datei für jedes Jahr verfügt!
Bevor Sie mit der Datenanalyse in Tableau beginnen können, müssen Sie zunächst eine gründliche Datenbereinigung durchführen. Ihnen steht eine lange Nacht bevor.
Während Sie in den Speisekarten von Restaurants stöbern, um sich ein Abendessen zu bestellen, fällt Ihnen ein, dass Tableau das Produkt Tableau Prep anbietet, das bei der Herkulesaufgabe der Datenbereinigung hilfreich sein kann.
Sie laden das Produkt herunter oder registrieren sich für eine kostenlose Testversion(Link wird in neuem Fenster geöffnet) und probieren es aus.
1. Herstellen einer Verbindung zu Daten
Wenn Sie Tableau Prep Builder öffnen, wird wie in Tableau Desktop zuerst eine Startseite mit dem Bereich Verbindungen angezeigt.
Im ersten Schritt stellen Sie eine Verbindung zu Ihren Daten her und erstellen einen Eingabeschritt. Dieser dient als Ausgangspunkt für die Erstellung eines Workflows oder "Schemata", so die offizielle Benennung in Tableau Prep. Im weiteren Verlauf fügen Sie weitere Schritte hinzu, um Aktionen für Ihre Daten auszuführen.
Tipp: Der Eingabeschritt ist der Erfassungspunkt für Ihre Daten und der Ausgangspunkt für Ihr Schema. Sie können mehrere Eingabeschritte verwenden, und einige Eingabeschritte können mehrere Datendateien beinhalten. Weitere Informationen zum Herstellen einer Verbindung zu Daten finden Sie unter Herstellen einer Verbindung zu Daten(Link wird in neuem Fenster geöffnet).
Ihre Vertriebsdatendateien für die verschiedenen Regionen sind in verschiedenen Formaten gespeichert, und bei den Aufträgen aus dem Süden handelt es sich in der Tat um mehrere Dateien. Sie sehen sich den Bereich Verbindungen an und stellen fest, dass Sie viele Möglichkeiten zum Herstellen einer Verbindung zu Daten haben. Großartig!
Da die anderen Regionen über eine einzelne Datei mit Daten für alle vier Jahre verfügen, entscheiden Sie, sich die Dateien aus dem Süden zuerst vorzunehmen.
Klicken Sie im Bereich Verbindungen auf die Schaltfläche Verbindung hinzufügen .
Klicken Sie bei der Webdokumenterstellung auf der Startseite auf Erstellen > Schema oder auf der Seite Erkunden auf Neu > Schema. Klicken Sie anschließend auf Verbindung zu Daten herstellen.
Bei den Dateien handelt es sich um CSV-Dateien. Wählen Sie daher in der Verbindungsliste den Eintrag Textdatei aus.
Navigieren Sie zu dem Verzeichnis für Ihre Dateien. Wählen Sie im Unterverzeichnis "Orders South" die erste Datei orders_south_2015.csv aus, und klicken Sie auf Öffnen, um sie Ihrem Schema hinzuzufügen. (Informationen zum Dateispeicherort finden Sie unter Nachbereitung und Ressourcen.)
Nachdem Sie eine Verbindung zu Ihrer ersten Datei hergestellt haben, wird der Tableau Prep Builder-Arbeitsbereich geöffnet, und Sie sehen, dass er in zwei Hauptbereiche unterteilt ist. Oben befindet sich der Bereich Schema, und unten ist der Bereich Eingabe angeordnet.
Der Bereich Schema ist Ihr Arbeitsbereich ähnlich dem von Tableau Desktop, in dem Sie visuell mit Ihren Daten interagieren und Ihr Schema erstellen können. Der Bereich Eingabe enthält Konfigurationsoptionen zur Erfassung der Daten. Zudem werden dort die Felder, Datentypen und Beispielwerte aus Ihrem Datensatz angezeigt.
Im nächsten Abschnitt erfahren Sie, wie Sie mit diesen Daten interagieren können.
Tipp: Bei einzelnen Tabellen erstellt Tableau Prep im Bereich Schema automatisch einen Eingabeschritt für Sie, wenn Sie Ihrem Schema Daten hinzufügen. Andernfalls können Sie dem Bereich Schema per Drag & Drop Tabellen hinzufügen.
Sie haben drei weitere Dateien für Ihre Bestellungen im Süden und wie Sie sie kombinieren, hängt davon ab, wo Sie arbeiten.
In Tableau Prep Builder:
- Sie könnten jede Datei einzeln hinzufügen, möchten jedoch alle Dateien in einem Eingabeschritt zusammenfassen. Daher klicken Sie auf die Registerkarte Tabellen im Bereich Eingabe.
Es wird eine Option für Vereinigung mehrerer Tabellen angezeigt. Wählen Sie sie aus.
Sie stellen fest, dass das Verzeichnis, in dem Sie Ihre Datei ausgewählt haben, bereits ausgefüllt ist und dass die anderen von Ihnen benötigten Dateien im Abschnitt Enthaltene Dateien im Bereich "Eingabe" aufgelistet sind.
Tipp: Die Platzhaltervereinigung eignet sich hervorragend, um mehrere Dateien aus einer einzelnen Datenquelle mit ähnlichem Namen und ähnlicher Struktur zusammenzuführen und eine Verbindung dazu herzustellen. Wenn Sie diese Option verwenden möchten, müssen sich die Dateien in demselben unter- oder übergeordneten Verzeichnis befinden. Wenn die benötigten Dateien nicht angezeigt werden, ändern Sie die Suchkriterien. Weitere Informationen dazu finden Sie unter Vereinigen von Dateien und Datenbanktabellen im Schritt "Eingabe"(Link wird in neuem Fenster geöffnet).
Klicken Sie auf Übernehmen, um die Daten aus diesen Dateien dem Eingabeschritt orders_south_2015 hinzuzufügen.
Bei den Dateien für die anderen Regionen handelt es sich ausschließlich um einzelne Tabellendateien, sodass Sie alle Dateien gleichzeitig auswählen und sie Ihrem Schema hinzufügen können.
Hinweis: Im Internet können Dateien nur einzeln hochgeladen werden.
In Tableau Server oder Tableau Cloud:
Die Platzhalteroption ist derzeit für Tableau Server oder Tableau Cloud nicht verfügbar. Dennoch möchten Sie alle Dateien aus dem Süden einschließen und die Daten gleichermaßen verarbeiten, sodass eine Kombination dieser Dateien sinnvoll ist.
- Wiederholen Sie die Schritte 2 und 3, um die restlichen Dateien aus dem Unterverzeichnis "Orders South" hinzuzufügen.
- Kombinieren Sie sie mit einem Vereinigungsschritt. (Weitere Einzelheiten dazu finden Sie unter Vereinigen von Dateien und Datenbanktabellen im Schritt "Eingabe"(Link wird in neuem Fenster geöffnet).)
Ziehen Sie Orders_South_2016 über Orders_South_2015, und legen Sie sie unter der Option Vereinigen ab.
Ziehen Sie Orders_South_2017 auf den neuen Vereinigungsschritt, und legen Sie sie unter Hinzufügen ab. Wiederholen Sie diesen Schritt mit der endgültigen Datei.
Fügen Sie die verbleibenden Dateien hinzu.
In Tableau Prep Builder:
- Öffnen Sie den Datei-Explorer oder Finder, und navigieren Sie zu dem Verzeichnis für die Dateien. Wählen Sie die folgenden Dateien per Strg-Klick (Befehlstaste-Klick bei MacOS) aus, und verschieben Sie sie per Drag & Drop in den Bereich Schema, um sie Ihrem Schema hinzuzufügen. (Informationen zum Dateispeicherort finden Sie unter Nachbereitung und Ressourcen.)
- Orders_Central.csv
- Orders_East.xlsx
- Orders_West.csv
Hinweis: Dies sind verschiedene Dateitypen. Wenn nicht all diese Dateien angezeigt werden, stellen Sie sicher, dass in Ihrem Datei-Explorer oder Finder die Anzeige aller Dateitypen festgelegt ist.
In Tableau Server oder Tableau Cloud:
- Führen Sie die Schritte 2 und 3 aus, um "Orders_Central.csv" und "Orders_West.csv" hinzuzufügen.
- Klicken Sie im Bereich Verbindungen auf die Schaltfläche Verbindung hinzufügen . Klicken Sie auf Microsoft Excel, und wählen Sie Orders_East.xlsx aus.
- Öffnen Sie den Datei-Explorer oder Finder, und navigieren Sie zu dem Verzeichnis für die Dateien. Wählen Sie die folgenden Dateien per Strg-Klick (Befehlstaste-Klick bei MacOS) aus, und verschieben Sie sie per Drag & Drop in den Bereich Schema, um sie Ihrem Schema hinzuzufügen. (Informationen zum Dateispeicherort finden Sie unter Nachbereitung und Ressourcen.)
Kontrollieren Sie Ihre Arbeit: Sehen Sie das "Herstellen einer Verbindung zu Daten" in Aktion.
Klicken Sie zur erneuten Wiedergabe auf das Bild.
2. Untersuchen von Daten
Nachdem Sie die Datendateien nun in Tableau Prep geladen haben, möchten Sie sicherlich alle Dateien miteinander kombinieren. Zuvor empfiehlt es sich jedoch, sie zunächst zu überprüfen, um mögliche Probleme ausfindig zu machen.
Wenn Sie im Bereich Schema einen Eingabeschritt auswählen, werden die Einstellungen zum Erfassen der Daten, die enthaltenen Felder und eine Vorschau der Werte angezeigt.
Sie sollten nun entscheiden, wie viele Daten Sie in das Schema einbeziehen möchten, und Sie sollten nicht benötigte Felder entfernen oder filtern. Sie können auch Datentypen ändern, die falsch zugeordnet wurden.
Tipp: Wenn Sie mit großen Datensätzen arbeiten, fügt Tableau Prep automatisch eine Stichprobe der Daten hinzu, um die Leistung zu maximieren. Wenn die erwarteten Daten nicht angezeigt werden, müssen Sie die Stichprobe möglicherweise anpassen. Dazu können Sie die Registerkarte Stichprobe verwenden. Weitere Informationen zum Konfigurieren Ihrer Datenoptionen und Stichprobengröße finden Sie unter Festlegen der Stichprobengröße(Link wird in neuem Fenster geöffnet).
Während Sie im Bereich Schema die einzelnen Schritte auswählen und sämtliche Datensätze überprüfen, fallen Ihnen einige Dinge auf, die Sie später korrigieren möchten. Zudem bemerken Sie einen Aspekt, den Sie jetzt im Schritt Eingabe berichtigen können.
Wählen Sie den Eingabeschritt Orders_West aus.
Im Feld Bundesstaat werden Abkürzungen für den Namen des Bundesstaats verwendet. In anderen Dateien wird er ausgeschrieben. Dies müssen Sie später korrigieren.
Mehrere Felder beginnen mit Right_. Bei diesen Feldern handelt es sich scheinbar um Duplikate der anderen Felder. Diese Duplikate sollten Sie nicht in das Schema einbeziehen. Sie können dies direkt hier im Schritt Eingabe korrigieren:
Wenn Sie dieses Problem jetzt beheben möchten, deaktivieren Sie das Kontrollkästchen für alle Felder, die mit Right_ beginnen. Dadurch ignoriert Tableau Prep diese Felder, und sie werden nicht in das Schema einbezogen.
Tipp: Beim Ausführen von Bereinigungsvorgängen in einem Schritt, beispielsweise beim Entfernen von Feldern, überwacht Tableau Prep Ihre Änderungen im Anpassungsbereich und fügt eine Anmerkung (in Form eines kleinen Symbols) im Schemabereich hinzu, um Ihnen beim Nachverfolgen der Aktionen zu helfen, die Sie für Ihre Daten ausführen. Bei Eingabeschritten wird zudem jedem Feld eine Anmerkung hinzugefügt.
Klicken Sie im Bereich Schema auf den Eingabeschritt Orders_Central, um ihn auszuwählen. Im Bereich Eingabe fallen Ihnen die folgenden Probleme auf:
Die Bestell- und Liefertermine sind in Felder für Monat, Tag und Jahr unterteilt.
- Einige Felder weisen andere Datentypen auf als dieselben Felder in anderen Dateien.
Es existiert kein Feld für die Region.
Sie müssen diese Felder bereinigen, bevor Sie diese Datei mit den anderen Dateien kombinieren können. Dies ist jedoch hier im Schritt Eingabe nicht möglich. Sie machen sich daher eine Notiz, um sich später darum zu kümmern.
Wählen Sie den Eingabeschritt Orders_East aus.
Die Felder in dieser Datei lassen sich offensichtlich problemlos mit den anderen Dateien kombinieren. Scheinbar ist jedoch in allen Werten für den Umsatz der Währungscode enthalten. Dies müssen Sie später ebenfalls korrigieren.
Da Sie nun einige Problemstellen in Ihren Datensätzen identifiziert haben, untersuchen Sie im nächsten Schritt die Daten etwas genauer und bereinigen die gefundenen Probleme, sodass Sie Ihre Daten kombinieren und formen sowie eine Ausgabedatei generieren können, die für die Analyse verwendet werden kann.
3. Bereinigen von Daten
Das Untersuchen und Bereinigen von Daten in Tableau Prep ist ein iterativer Prozess. Nachdem Sie sich für einen Datensatz entschieden haben, mit dem Sie arbeiten möchten, untersuchen Sie im nächsten Schritt diese Daten, und Sie führen verschiedene Aktionen aus, indem Sie diverse Bereinigungs-, Formungs- und Kombinierungsvorgänge darauf anwenden. Sie wenden diese Vorgänge an, indem Sie Ihrem Schema Schritte hinzufügen. Weitere Informationen zu Bereinigungsoptionen finden Sie unter Bereinigen und Formen von Daten(Link wird in neuem Fenster geöffnet).
Je nachdem, was Sie tun möchten, gibt es verschiedene Schritte. Fügen Sie beispielsweise einen Bereinigungsschritt hinzu (Schritt hinzufügen), wenn Sie Bereinigungsvorgänge wie Filtern, Zusammenführen, Teilen, Umbenennen usw. auf Ihre Felder anwenden möchten. Fügen Sie einen Aggregationsschritt hinzu, um Felder zu gruppieren und zu aggregieren und die Detailstufe Ihrer Daten zu ändern. Weitere Informationen zu den verschiedenen Schritttypen und ihrer Anwendung finden Sie unter Erstellen und Organisieren Ihres Schemas(Link wird in neuem Fenster geöffnet).
Tipp: Beim Hinzufügen von Schritten zu Ihrem Schema wird automatisch eine Schemalinie hinzugefügt, um die Schritte miteinander zu verbinden. Sie können diese Schemalinien verschieben und nach Bedarf entfernen oder hinzufügen.
Beim Ausführen des Schemas sind diese Verbindungspunkte erforderlich, damit Tableau Prep weiß, welche Schritte miteinander verbunden sind und in welcher Reihenfolge die Schritte im Schema angewendet werden. Wenn eine Schemalinie fehlt, wird das Schema unterbrochen, und Sie erhalten eine Fehlermeldung.
Bereinigen von "Orders_Central"
Um die zuvor erkannten Probleme zu beheben und zu prüfen, ob weitere Probleme vorliegen, fügen Sie zunächst dem Eingabeschritt Orders_Central einen Bereinigungsschritt hinzu.
Wählen Sie im Bereich Schema den Eintrag Orders_Central aus, und führen Sie eine der folgenden Aktionen aus:
- Klicken Sie auf das Plus-Symbol , und fügen Sie einen Bereinigungsschritt hinzu. Je nach Version lautet diese Menüoption Schritt hinzufügen, Bereinigungsschritt hinzufügen oder Bereinigungsschritt.
Klicken Sie auf den vorgeschlagenen Bereinigungsschritt (Tableau Prep Builder-Version 2020.3.3 und höher und im Internet)
Wenn Sie Ihrem Schema einen Bereinigungsschritt hinzufügen, ändert sich der Arbeitsbereich, und es werden die Details zu Ihren Daten angezeigt.
A. Bereich "Schema", B. Symbolleiste, C. Bereich "Profil", D. Datenraster
Der Arbeitsbereich wird nun in drei Teile aufgeteilt: in den Bereich Schema, den Bereich Profil mit einer Symbolleiste und in das Raster Daten.
Im Bereich Profil wird die Struktur Ihrer Daten angezeigt. Dabei werden die Feldwerte in Partitionen zusammengefasst, sodass Sie die zugehörigen Werte schnell zuordnen und Ausreißer und Nullwerte erkennen können. Im Raster Daten werden die Zeilenebenendetails für Ihre Felder angezeigt.
Tipp: Alle Felder im Bereich Profil werden auf einer Profilkarte angezeigt. Mithilfe des Menüs Weitere Optionen (in vorherigen Versionen waren dies Dropdown-Pfeile) auf den einzelnen Karten können Sie die verschiedenen Bereinigungsoptionen anzeigen und auswählen, die für den jeweiligen Feldtyp verfügbar sind. Sie können die Feldwerte auch sortieren, den Datentyp ändern, dem Feld eine Datenrolle zuordnen oder die Profilkarten und Spalten im Raster Daten per Drag-and-Drop verschieben, um sie neu anzuordnen.
Bereinigen von Daten mit berechneten Feldern
In diesem Datensatz fehlt ein Feld für die Region. Da dieses Feld in den anderen Datensätzen enthalten ist, müssen Sie es hinzufügen, damit Sie Ihre Daten später kombinieren können. Dazu müssen Sie ein berechnetes Feld verwenden.
Klicken Sie in der Symbolleiste auf Berechnetes Feld erstellen.
Benennen Sie im Berechnungseditor das berechnete Feld Region. Geben Sie dann "Central" (mit den Anführungszeichen) ein, und klicken Sie auf Speichern.
Sie schätzen die Flexibilität hinsichtlich der Möglichkeit, Ihre Daten mithilfe von berechneten Feldern zu formen. Sie stellen begeistert fest, dass in Tableau Prep dieselbe Sprache für den Berechnungs-Editor verwendet wird wie in Tableau Desktop.
Tipp: Wenn Sie an den Feldern und Werten Änderungen vornehmen, werden sie von Tableau Prep im Bereich Anpassungsbereich auf der linken Seite überwacht. Zudem wird dem Bereinigungsschritt im Schema und dem Feld im Bereich Profil ein Symbol (Anmerkung) hinzugefügt, das auf die Änderung hindeutet. Wir werden uns den Anpassungsbereich ansehen, nachdem wir weitere Änderungen vorgenommen haben.
Im nächsten Schritt kümmern Sie sich um die separaten Felder für das Bestell- und Lieferdatum. Sie möchten sie in zwei einzelnen Feldern kombinieren, und zwar in einem Feld für das Bestelldatum und in einem Feld für das Lieferdatum, damit sie mit denselben Feldern in den anderen Datensätzen übereinstimmen. Wenn Sie sicherstellen, dass Ihre Tabellen die gleichen Felder haben, können Sie die Tabellen später mit einer Vereinigung kombinieren.
Sie können auch hier wieder ein berechnetes Feld verwenden, um dies in einem einfachen Schritt zu erledigen.
Klicken Sie in der Symbolleiste auf Berechnetes Feld erstellen, um die Felder Jahr der Bestellung, Monat der Bestellung, und Tag der Bestellung in einem Feld mit dem Format "MM/TT/JJJJ" zu kombinieren.
Benennen Sie im Berechnungseditor das berechnete Feld Bestelldatum. Geben Sie dann die folgende Berechnung ein und klicken Sie auf Speichern:
MAKEDATE([Order Year],[Order Month],[Order Day])
Sie verfügen nun über ein neues Feld für das Bestelldatum und möchten die vorhandenen Felder entfernen, da Sie sie nicht mehr benötigen.
Der Bereich Profil enthält viele Felder. Sie sehen, dass in der oberen rechten Ecke der Symbolleiste ein Suchfeld vorhanden ist. Sie fragen sich, ob Sie damit kurzerhand die Felder suchen können, die Sie entfernen möchten. Sie probieren es aus.
Geben Sie im Bereich Profil im Suchfeld den Eintrag Bestellung ein.
Tableau Prep führt kurzerhand einen Bildlauf durch alle Felder aus, deren Name den Eintrag Bestellung enthält und zeigt sie an. Großartig!
Wählen Sie per Strg-Klick (Befehlstaste-Klick bei MacOS) die Felder für Jahr der Bestellung, Monat der Bestellung und Tag der Bestellung aus. Klicken Sie dann mit der rechten Maustaste auf die ausgewählten Felder, und wählen Sie im Menü die Option Entfernen (Feld entfernen in früheren Versionen) aus, um sie zu entfernen.
Wiederholen Sie nun die Schritte 4 bis 7 oben, um ein einzelnes Feld für das Lieferdatum zu erstellen. Versuchen Sie es selbst, oder verwenden Sie die folgenden Schritte als Hilfe.
Klicken Sie in der Symbolleiste auf Berechnetes Feld erstellen, um die Felder Jahr der Lieferung, Monat der Lieferung, und Tag der Lieferung in einem Feld mit dem Format "MM/TT/JJJJ" zu kombinieren.
Geben Sie dem berechneten Feld den Namen Lieferdatum, und geben Sie die Berechnung
MAKEDATE([Ship Year],[Ship Month],[Ship Day])
ein. Klicken Sie anschließend auf Speichern.Entfernen Sie die Felder Jahr der Lieferung, Monat der Lieferung und Tag der Lieferung. Suchen Sie nach den Feldern, wählen Sie diese aus und wählen Sie im Menü den Eintrag Entfernen (bzw. Feld entfernen in früheren Versionen) aus, um die Felder zu entfernen.
Tipp: Tableau Prep fasst die Daten im Profilbereich in Partitionen zusammen, damit Sie die Form der Daten schnell erkennen, Ausreißer finden, Beziehungen zwischen den Feldern nachvollziehen können usw.
In diesem Szenario können die Bestell- und Liefertermine nun nach Jahr zusammengefasst werden. Jede Partition repräsentiert ein Jahr vom Januar des ersten Jahres bis zum Januar des Folgejahres und ist entsprechend beschriftet. Da einige Bestell- und Liefertermine auf den späteren Abschnitt der Jahre 2018 und 2019 fallen, erhalten wir eine Partition für diese Daten, die entsprechend mit Jahresende 2019 und 2020 beschriftet ist.
Wenn Sie diese Ansicht in das Ist-Datum ändern möchten, klicken Sie auf der Profilkarte auf das Menü Weitere Optionen (in früheren Versionen war dies ein Dropdown-Pfeil), und wählen Sie Detail aus.Direktes Interagieren mit Feldern zum Bereinigen der Daten
Ihre Daten nehmen langsam Form an. Als Sie mit dem Entfernen der zusätzlichen Felder für die Bestell- und Liefertermine fertig sind, bemerken Sie einige Probleme mit dem Feld Rabatte.
Es ist dem Datentyp Zeichenfolge anstatt Zahl (Dezimalzahl) zugeordnet.
Anstatt eines numerischen Werts für keinen Rabatt existiert der Feldwert Keine.
Dies führt zu einem Problem beim Kombinieren der Dateien, daher sollten Sie dies ebenfalls korrigieren.
Löschen Sie Ihre Suche, und geben Sie Rab in das Suchfeld ein, um das Feld zu suchen.
Wählen Sie das Feld Rabatte aus, doppelklicken Sie auf den Feldwert Keine, und ändern Sie ihn in den numerischen Wert 0.
Um den Datentyp für das Feld Rabatt von Zeichenfolge in Zahl (Dezimalzahl) zu ändern, klicken Sie auf Abc und wählen Sie im Dropdown-Menü die Option Zahl (Dezimalzahl) aus.
Benennen Sie schlussendlich den Schritt, um Ihre Aktionen in diesem Schritt besser nachvollziehen zu können. Doppelklicken Sie im Bereich Schema auf den Schrittnamen Bereinigen 1, und geben Sie Termine/Feldnamen korrigieren ein.
Überprüfen der Änderungen
Sie haben an diesem Datensatz viele Änderungen vorgenommen und machen sich Sorgen, dass Sie sich nicht mehr an alles erinnern können, was Sie getan haben. Während Sie Ihre Arbeit prüfen, fällt Ihnen links im Bereich Profil die Spalte Änderungen auf.
Sie klicken auf den Pfeil, um sie zu öffnen, und Sie sehen eine Liste mit allen Änderungen, die Sie gerade vorgenommen haben. Während Sie einen Bildlauf durch die Änderungen in der Liste durchführen, bemerken Sie, dass Sie Ihre Änderungen löschen oder bearbeiten und sogar verschieben können, um die Reihenfolge zu ändern, in der sie vorgenommen wurden.
Sie sind begeistert davon, dass Sie die in den Schritten vorgenommenen Änderungen beim Erstellen des Schemas problemlos finden und mit der Reihenfolge dieser Änderungen experimentieren können, um Ihre Daten optimal zu nutzen.
Kontrollieren Sie Ihre Arbeit: Sehen Sie das "Bereinigen von Orders_Central" in Aktion.
Klicken Sie zur erneuten Wiedergabe auf das Bild.
Da Sie nun eine Datei bereinigt haben, sehen Sie sich die anderen Dateien an, um zu prüfen, welche weiteren Probleme Sie beheben müssen.
Sie sehen sich als Nächstes die Excel-Datei für Orders_East an.
Bereinigen von "Orders_East"
Während Sie die Felder der Datei Orders_East prüfen, stimmen mit Ausnahme des Feldes Umsatz die meisten Felder offenbar mit den anderen Dateien überein. Um sich dies genauer anzusehen und zu prüfen, ob weitere Probleme gelöst werden müssen, fügen Sie dem Eingabeschritt Orders_East einen Bereinigungsschritt hinzu.
Wählen Sie im Bereich Schema den Eintrag Orders_East aus, und führen Sie eine der folgenden Aktionen aus:
- Klicken Sie auf das Plus-Symbol , und fügen Sie einen Bereinigungsschritt hinzu. Je nach Version lautet diese Menüoption Schritt hinzufügen, Bereinigungsschritt hinzufügen oder Bereinigungsschritt.
- Klicken Sie auf den vorgeschlagenen Bereinigungsschritt (Tableau Prep Builder-Version 2020.3.3 und höher und im Internet).
Während Sie das Feld Umsatz prüfen, stellen Sie schnell fest, dass der Währungscode USD in die Umsatzzahlen eingefügt wurde und dass Tableau Prep diese Feldwerte als Zeichenfolge interpretiert hat.
Sie müssen den Währungscode aus diesem Feld entfernen und den Datentyp ändern, wenn Sie exakte Vertriebsdaten haben möchten.
Sie haben bereits gelernt, wie sich der Datentyp problemlos korrigieren lässt. Es liegen jedoch mehr als 2000 eindeutige Zeilen mit Umsatzdaten vor, und eine Korrektur der einzelnen Zeilen, um den Währungscode zu entfernen, scheint sehr mühsam.
Sie haben jedoch Tableau Prep und sehen im Dropdown-Menü nach, ob es eine Option zur Behebung dieses Problems gibt.
Wenn Sie auf die Option Weitere Optionen (Dropdown-Pfeil in früheren Versionen) für das Feld Vertrieb klicken, sehen Sie eine Menüoption namens Bereinigen und darunter eine Option zum Entfernen von Buchstaben. Sie probieren sie aus, um den Effekt zu testen.
Wählen sie das Feld Umsatz aus. Klicken Sie auf das Menü Weitere Optionen (in vorherigen Versionen waren dies Dropdown-Pfeile) und wählen Sie Bereinigen > Buchstaben entfernen aus.
Toll! Diese Bereinigungsoption hat den Währungscode direkt aus allen Feldern entfernt. Jetzt müssen Sie lediglich den Datentyp von Zeichenfolge in Zahl (Dezimalzahl) ändern, damit die Datei ordentlich aussieht.
Klicken Sie auf den Datentyp für das Feld Umsatz und wählen Sie Zahl (dezimal) aus der Dropdown-Liste, um den Datentyp zu ändern.
Der Rest der Datei sieht recht ordentlich aus. Benennen Sie den Bereinigungsschritt, um Ihre Arbeit nachverfolgen zu können. Beispiel: Datentyp ändern.
Als Nächstes sehen Sie sich die letzte Datei für Orders_West an, um sie auf Probleme zu prüfen, die Sie beheben müssen.
Bereinigen von "Orders_West"
Während Sie die Felder für die Datei Orders_West prüfen, stimmen die meisten Felder scheinbar mit den anderen Dateien überein. Sie erinnern sich jedoch daran, dass im Feld Bundesstaaten Abkürzungen für die Werte verwendet wurden, anstatt den Namen des Bundesstaats auszuschreiben. Wenn Sie diese Datei mit den anderen Dateien kombinieren möchten, müssen Sie dieses Problem beheben. Sie fügen daher dem Eingabeschritt Orders_West einen Bereinigungsschritt hinzu.
Wählen Sie im Bereich Schema den Eintrag Orders_West aus, und führen Sie eine der folgenden Aktionen aus:
- Klicken Sie auf das Plus-Symbol , und fügen Sie einen Bereinigungsschritt hinzu.
- Klicken Sie auf den vorgeschlagenen Bereinigungsschritt (Tableau Prep Builder-Version 2020.3.3 und höher und im Internet).
Führen Sie einen Bildlauf durch, oder verwenden Sie die Suche, um das Feld Bundesstaat zu suchen.
Sie stellen fest, dass für alle Bundesstaatenwerte die Kurzform der Abkürzung verwendet wird. Für dieses Feld sind nur 11 eindeutige Werte vorhanden. Sie könnten sie manuell einzeln ändern, aber vielleicht gibt es in Tableau Prep eine andere Methode?
Wenn Sie für dieses Feld auf das Menü Weitere Optionen (in vorherigen Versionen war dies der Dropdown-Pfeil) klicken, sehen Sie die Option Werte gruppieren (Gruppieren und Ersetzen in früheren Versionen). Wenn Sie sie auswählen, werden verschiedene Optionen angezeigt:
Manuelle Auswahl
Aussprache
Gemeinsame Zeichen
- Schreibweise
Die Namen der Bundesstaaten klingen nicht gleich, sind nicht falsch geschrieben und haben nicht dieselben Zeichen. Daher entscheiden Sie sich für die Option Manuelle Auswahl.
Tipp: Sie können auf einen Feldnamen oder Feldwert doppelklicken, um einen einzelnen Wert zu bearbeiten. Wenn Sie mehrere Werte bearbeiten möchten, können Sie alle Werte auswählen und die Kontextmenü-Option Werte bearbeiten verwenden. Falls Sie jedoch speziellen Werten einen oder mehrere Werte zuordnen möchten, verwenden Sie die Option Werte gruppieren im Dropdown-Menü.
Weitere Informationen über das Bearbeiten und Gruppieren von Werten finden Sie unter Feldwerte bearbeiten(Link wird in neuem Fenster geöffnet).Wählen sie das Feld Bundesstaat aus. Klicken Sie auf den Dropdown-Pfeil und wählen Sie Gruppieren und Ersetzen > Manuelle Auswahl aus.
Eine Karte mit zwei Spalten wird geöffnet. Dies ist der Editor zum Gruppieren von Werten. In der Spalte auf der linken Seite werden die aktuellen Feldwerte angezeigt, während in der Spalte auf der rechten Seite die Felder angezeigt werden, die für die Zuordnung zu den Feldern auf der linken Seite verfügbar sind.
Sie möchten die Abkürzungen der Bundesstaaten der ausgeschriebenen Version des Bundesstaatnamens zuordnen, diese Werte sind jedoch im Datensatz Orders_West nicht enthalten. Sie fragen sich, ob Sie einfach den Namen direkt bearbeiten und dort einfügen können und probieren es aus.
Doppelklicken Sie im Editor zum Gruppieren und Ersetzen im linken Bereich auf AZ, um den Wert zu markieren, und geben Sie Arizona ein. Drücken Sie dann die Eingabetaste, um Ihre Änderung hinzuzufügen.
Tableau Prep hat einen Zuordnungswert für den neuen Wert Arizona erstellt und ihm automatisch den alten Wert AZ zugeordnet. Die Einrichtung einer Zuordnungsbeziehung für diese Werte spart Zeit, wenn Sie auf diese Art und Weise weitere Daten aus dieser Region eingeben.
Tipp: Sie können Feldwerte hinzufügen, die nicht in Ihrer Stichprobe enthalten sind, um Zuordnungsbeziehungen zum Organisieren Ihrer Daten einzurichten. Wenn Sie Ihre Datenquelle aktualisieren und neue Daten hinzugefügt werden, können Sie die neuen Daten der Zuordnung hinzufügen, anstatt die einzelnen Werte manuell zu korrigieren.
Beim manuellen Hinzufügen eines Werts, der nicht in Ihrer Stichprobe enthalten ist, wird der Wert mit einem roten Punkt markiert, sodass sie ihn leicht identifizieren können.Wiederholen Sie diese Schritte, um die einzelnen Bundesstaaten der ausgeschriebenen Version des zugehörigen Namens zuzuordnen.
Abkürzung Name des Bundesstaats AZ Arizona CA Kalifornien CO Colorado ID Idaho MT Montana NM Neumexiko NV Nevada OR Oregon UT Utah WA Washington WY Wyoming Klicken Sie dann auf Fertig, um den Editor zum Gruppieren und Ersetzen zu schließen.
Nachdem alle Bundesstaaten zugeordnet wurden, überprüfen Sie im Anpassungsbereich, ob statt 11 Einträgen nur noch ein Eintrag vorhanden ist.
Tableau Prep hat ähnliche Aktionen für ein Feld zusammen gruppiert. Das kommt Ihnen entgegen, da Sie somit an Ihrem Datensatz vorgenommene Änderungen später leichter finden können.
Die Korrektur der Feldwerte für den Bundesstaat war die einzige Änderung, die Sie an dieser Stelle vornehmen mussten.
Benennen Sie den Bereinigungsschritt, um Ihre Arbeit nachverfolgen zu können. Beispiel: Bundesstaaten umbenennen.
Sie haben in Ihren Dateien viele Bereinigungen durchgeführt und können gar nicht glauben, wie schnell und einfach das war. Vielleicht schaffen Sie es doch noch zum Abendessen nach Hause! Speichern Sie Ihr Schema, um sicherzustellen, dass Ihre bisherige Arbeit nicht verloren geht.
Hinweis: Wenn Sie im Internet arbeiten, werden Ihre Änderungen automatisch unmittelbar gespeichert. Dabei wird ein Entwurfsschema erstellt. Klicken Sie in den Entwurfstitel, um den Entwurf zu benennen. Weitere Informationen zum Erstellen im Internet finden Sie unter Tableau Prep im Internet in der Tableau Server(Link wird in neuem Fenster geöffnet)- oder Tableau Cloud(Link wird in neuem Fenster geöffnet)-Hilfe.
Klicken Sie auf Datei > Speichern oder auf Datei > Speichern unter. Speichern Sie Ihre Datei als Schemadatei (.tfl), und benennen Sie sie. Beispiel: Mein Superstore.
Tipp: Sie können Ihre Schemadateien als Schemadatei (.tfl) oder als gepackte Datei (.tflx) speichern und Ihre lokalen Datendateien darin packen, um das Schema und die Dateien für andere Personen freizugeben. Weitere Informationen zum Speichern und Freigeben von Schemata finden Sie unter Speichern und Freigeben Ihrer Arbeit(Link wird in neuem Fenster geöffnet).
4. Kombinieren von Daten
Sie haben nun alle Dateien bereinigt und können sie kombinieren.
Da alle Dateien nach der Bereinigung ähnliche Felder haben, müssen Sie die Tabellen vereinigen, um alle Zeilen in einer einzigen Tabelle zusammenzufassen.
Sie erinnern sich an die Schrittoption Vereinigung hinzufügen, fragen sich jedoch, ob Sie die Schritte einfach per Drag-and-Drop verschieben können, um sie zu vereinigen. Sie probieren es aus.
Vereinigen von Daten
Führen Sie die Schritte für die Anwendung aus, in der Sie arbeiten.
Tableau Prep Builder
Ziehen Sie im Bereich Schema den Bereinigungsschritt Bundesstaaten umbenennen zum Bereinigungsschritt Datentyp ändern, und legen Sie ihn unter der Option Vereinigen ab.
Sie stellen fest, dass Tableau Prep Builder Ihrem Schema den neuen Schritt Vereinigung hinzugefügt hat. Großartig! Nun möchten Sie dieser Vereinigung auch die anderen Dateien hinzufügen.
Tableau Server oder Tableau Cloud
Ziehen Sie im Bereich Schemaden Bereinigungsschritt Bundesstaaten umbenennen zu dem zuvor erstellten Vereinigungsschritt für Ihre South-Dateien, und legen Sie ihn unter der Option Hinzufügen ab.
Sie sehen, dass Tableau Prep Ihre neuen Dateien der vorherigen Vereinigung hinzugefügt hat. Großartig! Nun möchten Sie dieser Vereinigung auch die anderen Dateien hinzufügen.
Ziehen Sie den nächsten Bereinigungsschritt im Schema zum Schritt Vereinigen, und legen Sie ihn dann unter Hinzufügen ab, um ihn der bestehenden Vereinigung hinzuzufügen.
Ziehen Sie den verbleibenden Schritt (Eingabeschritt orders_south_2015, wenn Sie in Tableau Prep Builder arbeiten, oder Ihren Bereinigungsschritt, wenn Sie im Internet arbeiten) zum neuen Schritt Vereinigen. Legen Sie ihn unter Hinzufügen ab, um ihn der vorhandenen Vereinigung hinzuzufügen.
All Ihre Dateien werden nun in einer einzelnen Tabelle kombiniert. Wählen Sie im Bereich Schema den Schritt Vereinigung aus, um die Ergebnisse zu prüfen.
In Tableau Prep Builder:
In Tableau Server oder Tableau Cloud:
Sie stellen fest, dass Tableau die Felder mit identischen Namen und Typen automatisch zugeordnet hat.
Zudem bemerken Sie, dass die Farben, die den Schritten im Schema zugeordnet waren, in den Vereinigungsprofilen verwendet werden. Dadurch wird deutlich, woher das Feld stammt. Zudem werden sie in dem Farbband an der Oberkante der einzelnen Felder angezeigt, um Sie darüber zu informieren, ob das jeweilige Feld in der betreffenden Tabelle vorhanden ist.
Sie sehen, dass das neue Feld Tabellennamen hinzugefügt wurde. Darin werden die Tabellen aufgelistet, aus denen alle Zeilen in der Vereinigung stammen.
Im Zusammenfassungsbereich wird zudem eine Liste mit nicht übereinstimmenden Feldern angezeigt, und Sie sehen sofort, dass die Felder Produkt und Rabatte nur in der Datei Orders_Central erscheinen.
Um diese Felder genauer zu untersuchen, aktivieren Sie im Bereich Vereinigungsergebnisse das Kontrollkästchen Nur nicht übereinstimmende Felder anzeigen.
Bei der Überprüfung des Datenfelds stellen Sie schnell fest, dass zwar die Daten identisch sind, die Feldnamen jedoch voneinander abweichen. Sie könnten das Feld einfach umbenennen, fragen sich jedoch, ob Sie diese Felder einfach per Drag-and-Drop verschieben können, um sie zusammenzuführen. Sie probieren es aus.
Wählen Sie das Feld Produkt aus, und ziehen Sie es per Drag-and-Drop auf das Feld Produktname, um die Felder zusammenzuführen. Nach dem Zusammenführen der Felder werden sie nicht mehr in dem Bereich angezeigt.
Wiederholen Sie diesen Schritt, um das Feld Rabatte mit dem Feld Rabatt zusammenzuführen.
Das einzige Feld, für das noch keine Übereinstimmung vorliegt, ist das Feld Dateipfade. In Tableau Prep Builder werden in diesem Feld die Dateipfade für die Platzhaltervereinigung angezeigt, die Sie für Ihre Bestellungen aus dem Süden vorgenommen haben. Sie belassen dieses Feld an dieser Stelle, da es gute Informationen enthält.
Tipp: Beim Korrigieren nicht übereinstimmender Felder nach einer Vereinigung haben Sie verschiedene Optionen. Wenn Tableau Prep eine mögliche Übereinstimmung erkennt, wird sie gelb hervorgehoben. Wenn Sie die Felder zusammenführen möchten, zeigen Sie mit der Maus auf das hervorgehobene Feld, und klicken Sie auf die angezeigte Plus-Schaltfläche .
Weitere Möglichkeiten zum Zusammenführen von Feldern in einer Vereinigung finden Sie unter Korrigieren von nicht übereinstimmenden Feldern.Deaktivieren Sie das Kontrollkästchen Nur nicht übereinstimmende Felder anzeigen, um alle in der Vereinigung enthaltenen Felder anzuzeigen.
Benennen Sie Ihren Vereinigungsschritt so, dass nachvollziehbar ist, was diese Vereinigung enthält. Beispiel: Alle Bestellungen.
Kontrollieren Sie Ihre Arbeit: Sehen Sie das "Vereinigen von Daten" in Aktion.
Klicken Sie zur erneuten Wiedergabe auf das Bild.
Sie sind ein Bereinigungsgenie! Während Sie die Ergebnisse bewundern, ruft Ihr Chef an. Er vergaß zu erwähnen, dass Sie auch die Produktrücksendungen in Ihre Analyse einbeziehen sollen. Er hofft, dass dies keine großen Umstände bereitet. Mit Tableau Prep in Ihrem Toolkit ist dies überhaupt kein Problem.
Bereinigen der Produktrücksendungsdaten
Sie sehen sich die Excel-Datei an, die Ihnen Ihr Chef für Produktrücksendungen gesendet hat. Sie sieht etwas chaotisch aus. Sie fügen die neue Datei return_reasons new Ihrem Schema hinzu, um sie sich genauer anzusehen.
Klicken Sie im Bereich Verbindungen auf Verbindung hinzufügen. Wählen Sie Microsoft Excel aus, und navigieren Sie zu den Beispieldatendateien, die Sie für diese Übung verwendet haben. (Siehe Beispieldateien zum Herunterladen der Datei.)
Wählen Sie return reasons_new.xlsx aus, und klicken Sie dann auf Öffnen, um die Datei dem Schemabereich hinzuzufügen.
Aus dieser Datei möchten Sie lediglich vier Felder in Ihr Schema einbeziehen: Bestell-ID, Produkt-ID, Rücksendungsgrund und Hinweis.
Deaktivieren Sie im Bereich Eingabe für return_new das Kontrollkästchen am oberen Rand der Spalte ganz links, um alle Kontrollkästchen zu deaktivieren. Aktivieren Sie dann das Kontrollkästchen für die Felder Bestell-ID, Produkt-ID, Rücksendungsgrund und Hinweise.
Benennen Sie den Eingabeschritt um, sodass er die in der Eingabe enthaltenen Daten besser widerspiegelt. Doppelklicken Sie im Bereich Schema auf den Namen des Eingabeschritts Returns_new, und geben Sie Rücksendungen (alle) ein.
Während Sie die Beispiel-Feldwerte untersuchen, bemerken Sie, dass in dem Feld Hinweise offensichtlich viele verschiedene Daten miteinander kombiniert wurden.
Sie müssen diese Datei bereinigen, bevor Sie die Daten weiter bearbeiten können. Sie fügen daher einen Bereinigungsschritt hinzu.
Wählen Sie im Bereich Schema den Eingabeschritt Rücksendungen (alle) aus, und klicken Sie auf das Pluszeichen oder auf den vorgeschlagenen Bereinigungsschritt, um einen Bereinigungsschritt hinzuzufügen.
Ändern Sie im Bereich Profil die Größe des Feldes Hinweise, damit die Einträge besser sichtbar sind. Klicken Sie auf den äußeren rechten Rand des Feldes und ziehen Sie ihn nach rechts.
Verwenden Sie im Feld Hinweise die visuelle Bildlaufleiste rechts neben den Feldwerten, um die Werte zu prüfen.
Sie stellen einige Probleme fest:
Einige Einträge haben ein zusätzliches Leerzeichen. Dies kann dazu führen, dass das Feld als Nullwert gelesen wird.
Scheinbar ist der Name des Genehmigers im Eintrag der Rücksendungshinweise enthalten. Um die Arbeit mit diesen Daten zu vereinfachen, möchten Sie diese Informationen in einem separaten Feld anordnen.
Sie möchten sich um die zusätzlichen Leerzeichen kümmern und erinnern sich an eine Bereinigungsoption zum Entfernen von nachstehenden Leerzeichen. Sie probieren sie aus, um das Problem zu beheben.
Wählen sie das Feld Hinweise aus. Klicken Sie auf das Menü Weitere Optionen (in vorherigen Versionen waren dies Dropdown-Pfeile) und wählen Sie Bereinigen > Leerzeichen kürzen aus.
Ja! Sie haben exakt das erreicht, was Sie wollten. Die zusätzlichen Leerzeichen sind nicht mehr da.
Als Nächstes möchten Sie ein separates Feld für den Namen des Genehmigers erstellen. Sie sehen die Option Werte aufteilen im Menü und möchten sie ausprobieren.
Wählen sie das Feld Hinweise aus. Klicken Sie auf das Menü Weitere Optionen (in vorherigen Versionen waren dies Dropdown-Pfeile) und wählen Sie Werte aufteilen > Automatische Aufteilung aus.
Diese Funktion hat Ihre Erwartungen vollständig erfüllt. Die Rücksendungshinweise und der Name des Genehmigers wurden automatisch in separate Felder aufgeteilt.
Genau wie Tableau Desktop hat Tableau Prep diesen Feldern automatisch einen Namen zugewiesen. Sie müssen die neuen Felder also sinnvoll umbenennen.
Wählen Sie das Feld Hinweise-Aufteilung 1 aus. Doppelklicken Sie auf den Feldnamen, und geben Sie Rücksendungshinweise ein.
Wiederholen Sie diesen Schritt für das zweite Feld, und benennen Sie es in Genehmiger um.
Entfernen Sie schlussendlich das ursprüngliche Feld Hinweise, da Sie es nicht mehr benötigen. Wählen Sie das Feld Hinweise aus, klicken Sie auf das Menü Weitere Optionen (in vorherigen Versionen waren dies Dropdown-Pfeile) und wählen Sie im Menü den Eintrag Entfernen (Feld entfernen in vorherigen Versionen) aus.
Sie untersuchen das neue Feld Genehmiger und stellen fest, dass unter den Feldwerten zwar dieselben Namen aufgelistet sind, diese jedoch unterschiedlich eingegeben wurden. Sie möchten sie gruppieren, um mehrere Varianten desselben Werts zu eliminieren.
Vielleicht ist dabei die Option Gruppieren und Ersetzen hilfreich?
Sie erinnern sich an die Option für Gemeinsame Zeichen. Da diese Werte dieselben Buchstaben enthalten, probieren Sie sie aus.
Wählen sie das Feld Genehmiger aus. Klicken Sie auf das Menü Weitere Optionen (in vorherigen Versionen waren dies Dropdown-Pfeile) und wählen Sie Gruppieren und Ersetzen > Gemeinsame Zeichen aus.
Diese Option hat alle Varianten der einzelnen Namen für Sie gruppiert. Genau das war Ihre Absicht.
Nachdem Sie die anderen Namen überprüft haben, um sicherzustellen, dass sie ordnungsgemäß gruppiert sind, klicken Sie auf Fertig, um den Editor zum Gruppieren und Ersetzen zu schließen.
Diese Datei sieht recht ordentlich aus.
Benennen Sie den Bereinigungsschritt, um Ihre Arbeit nachverfolgen zu können. Beispiel: Hinweise bereinigt.
Da nun alle Produktrücksendungsdaten bereinigt wurden, möchten Sie diese Daten den Bestellungsdaten aus den vereinigten Dateien hinzufügen. Viele dieser Felder sind jedoch in den vereinigten Dateien nicht vorhanden. Zum Hinzufügen dieser Felder (Spalten mit Daten) zu dem vereinigten Datensatz müssen Sie eine Verknüpfung verwenden.
Verknüpfen von Daten
Beim Verknüpfen von Daten müssen die Dateien mindestens ein gemeinsames Feld aufweisen. Ihre Dateien enthalten jeweils die Felder Bestell-ID und Produkt-ID, sodass Sie eine Verknüpfung für diese Felder durchführen können, um alle Zeilen anzuzeigen, die diese Felder gemeinsam haben. Sie erinnern sich an eine Option zum Erstellen einer Verknüpfung, als Sie Ihre Vereinigung per Drag-and-Drop erstellt haben, und Sie möchten sie ausprobieren.
Ziehen Sie im Bereich Schema den Schritt Hinweise bereinigt zum Vereinigungsschritt Alle Bestellungen, und legen Sie den Schritt unter Verknüpfung ab.
Beim Verknüpfen von Dateien zeigt Tableau Prep die Ergebnisse der Verknüpfung im Verknüpfungsprofil an.
Das Arbeiten mit Verknüpfungen kann sich kompliziert gestalten. Oftmals wünscht man sich eine klare Übersicht über die in die Verknüpfung einbezogenen Faktoren, beispielsweise die zum Verknüpfen der Dateien verwendeten Felder, die Anzahl der in den Ergebnissen enthaltenen Zeilen und Felder, die nicht einbezogen wurden oder Nullwerte sind.
Während Sie die Ergebnisse der Verknüpfung in Tableau Prep prüfen, sind Sie begeistert von der Fülle der Informationen und von der Interaktivität.
Tipp: Im äußersten linken Bereich des Verknüpfungsprofils können Sie die Verknüpfung untersuchen und damit interagieren. Sie können Werte auch direkt in den Bereichen für die Join-Klauseln korrigieren und im Bereich Verknüpfungsergebnisse Bereinigungsvorgänge ausführen.
Klicken Sie in das Diagramm Verknüpfungstyp, um verschiedene Verknüpfungskonfigurationen zu testen und die Anzahl der in der Verknüpfung enthaltenen oder daraus ausgeschlossenen Zeilen für die einzelnen Tabellen im Bereich Zusammenfassung der Verknüpfungsergebnisse anzuzeigen.
Wählen Sie im Bereich "Angewandte Join-Klauseln" die Felder aus, die Sie verknüpfen möchten, oder fügen Sie vorgeschlagene Join-Klauseln aus dem Bereich "Join-Klausel-Empfehlungen" hinzu.
Weitere Informationen zum Arbeiten mit Verknüpfungen finden Sie unter Aggregieren, Verknüpfen oder Vereinigen von Daten(Link wird in neuem Fenster geöffnet).Sie stellen fest, dass Sie mehr als 13.000 Zeilen aus den Dateien Alle Bestellungen ausgeschlossen haben. Beim Erstellen der Verknüpfung hat Tableau Prep automatisch eine Verknüpfung für das Feld Produkt-ID durchgeführt. Sie möchten jedoch auch eine Verknüpfung für das Feld Bestell-ID vornehmen.
Beim Überprüfen des linken Bereichs des Verknüpfungsprofils stellen Sie fest, dass die Bestell-ID in der Liste der empfohlenen Join-Klauseln enthalten ist, und Sie fügen sie kurzerhand von dort aus hinzu.
Wählen Sie im linken Bereich des Profils Verknüpfung im Bereich Join-Klausel-Empfehlungen den Eintrag Bestell-ID = Bestell-ID aus, und klicken Sie auf die Plus-Schaltfläche , um die Join-Klausel hinzuzufügen.
Da der Verknüpfungstyp auf eine innere Verknüpfung festgelegt ist (Standardeinstellung für Tableau Prep), werden nur Werte in die Verknüpfung einbezogen, die in beiden Dateien vorhanden sind. Sie möchten jedoch alle Daten aus den Dateien für die Bestellungen sowie die Rücksendungsdaten für diese Dateien einbeziehen. Demzufolge müssen Sie den Verknüpfungstyp ändern.
Klicken Sie im Abschnitt Verknüpfungstyp auf die Seite des Diagramms, um alle Bestellungen anzuzeigen. Klicken Sie im folgenden Beispiel auf die linke Seite des Diagramms, um den Verknüpfungstyp in eine Links-Verknüpfung zu ändern und alle Daten aus dem Vereinigungsschritt Alle Bestellungen und alle übereinstimmenden Daten aus dem Schritt Bereinigte Hinweise einzuschließen.
Nun haben Sie alle Daten aus den Bestellungsdateien und die Rücksendungsdaten einbezogen, die für diese Bestellungen zutreffen. Sie überprüfen den Bereich Verknüpfungsklauseln und sehen die eindeutigen Werte, die in der anderen Datei nicht vorhanden sind.
Es existieren beispielsweise viele Bestellungszeilen (rot dargestellt), für die keine entsprechenden Rücksendungsdaten vorhanden sind. Sie sind begeistert von der Möglichkeit, diese Detailstufe Ihrer Verknüpfung untersuchen zu können.
Sie sind darauf gespannt, die Analyse dieser Daten in Tableau Desktop zu starten, möchten jedoch vorher einige Ergebnisse der Verknüpfung bereinigen. Gut, dass Sie wissen, was zu tun ist!
Tipp: Sie fragen sich, ob Sie die Daten ausreichend bereinigt haben? Sie können aus Tableau Prep Builder in einem beliebigen Schritt des Schemas eine Vorschau Ihrer Daten in Tableau Desktop anzeigen, um dies zu prüfen.
Klicken Sie einfach mit der rechten Maustaste in den Bereich Schema, und wählen Sie im Menü den Eintrag Vorschau in Tableau Desktop aus.
Sie können sorglos mit Ihren Daten experimentieren, ohne dass die in Tableau Desktop vorgenommenen Änderungen in Ihre Datenquelle in Tableau Prep Builder zurückgeschrieben werden. Weitere Informationen finden Sie unter Anzeigen der Schemaausgabe in Tableau Desktop(Link wird in neuem Fenster geöffnet).Bevor Sie mit der Bereinigung Ihrer Verknüpfungsergebnisse beginnen, benennen Sie den Schritt Verknüpfung mit Bestellungen+Rücksendungen, und speichern Sie das Schema.
Bereinigen der Verknüpfungsergebnisse
Hinweis: Wenn Sie die Felder in Ihrer Verknüpfung bereinigen möchten, können Sie direkt im Verknüpfungsschritt Bereinigungsvorgänge ausführen. Für die Zwecke dieses Tutorials fügen wir einen Bereinigungsschritt hinzu, sodass Sie Ihre Bereinigungsvorgänge eindeutig erkennen können. Wenn Sie diese Schritte direkt im Verknüpfungsschritt ausführen möchten, überspringen Sie die Schritte 1 und 3 unten.
Als Sie die beiden Schritte verknüpft haben, wurden die gemeinsamen Felder "Bestell-ID" und "Produkt-ID" für beide Tabellen hinzugefügt.
Sie möchten das Feld "Produkt-ID" aus allen Bestellungen und das Feld "Bestell-ID" aus der Datei der Rücksendungen beibehalten und doppelte Felder, die in diesen Feldern enthalten waren, entfernen. Ferner benötigen Sie die Felder Dateipfade und Tabellennamen nicht in Ihrer Ausgabedatei. Daher möchten Sie auch diese Felder entfernen.
Tipp: Beim Verknüpfen von Tabellen mit Feldern, die in beiden Dateien vorhanden sind, fügt Tableau Prep beide Felder hinzu und benennt das doppelte Feld aus der zweiten Datei um, indem dem Feldnamen eine "-1" oder "-2" hinzugefügt wird. Beispiel: Bestell-ID und Bestell-ID-1.
Wählen Sie im Bereich Schema den Eintrag Bestellungen+Rücksendungen aus, klicken Sie auf das Pluszeichen und wählen Sie dann "Schritt hinzufügen" aus.
Wählen Sie im Bereich Profil die folgenden Felder aus, und entfernen Sie sie:
Tabellennamen
Bestell-ID
Dateipfade(nur Tableau Prep Builder)
Produkt-ID-1
Benennen Sie das Feld Bestell-ID-1 in Bestell-ID um.
Es liegen einige Nullwerte vor, bei denen das Produkt zurückgesendet, aber kein Rücksendungshinweis oder Genehmiger angegeben wurde. Damit diese Daten leichter analysiert werden können, möchten Sie ein Feld mit dem Wert Ja und Nein für die Angabe hinzufügen, ob das Produkt zurückgesendet wurde.
Dieses Feld ist nicht vorhanden. Sie können es jedoch hinzufügen, indem Sie ein berechnetes Feld erstellen.
Klicken Sie in der Symbolleiste auf Berechnetes Feld erstellen.
Benennen Sie das Feld mit Zurückgesendet?, geben Sie dann die folgende Berechnung ein, und klicken Sie auf Speichern.
If ISNULL([Return Reason])=FALSE THEN "Yes" ELSE "No" END
Für Ihre Analyse möchten Sie auch wissen, wie viele Tage es dauert, eine Bestellung zu liefern. Dieses Feld ist jedoch ebenfalls nicht vorhanden.
Sie haben jedoch alle Informationen, die Sie benötigen, um es zu erstellen. Daher fügen Sie ein weiteres berechnetes Feld hinzu, um das Feld zu erstellen.
Klicken Sie in der Symbolleiste auf Berechnetes Feld erstellen.
Benennen Sie das Feld mit Tage für Lieferung, geben Sie dann die folgende Berechnung ein, und klicken Sie auf Speichern.
DATEDIFF('day',[Order Date],[Ship Date])
Benennen Sie den Schritt mit Bestellungen+Rücksendungen bereinigen.
Speichern Sie Ihr Schema.
5. Ausführen des Schemas und Generieren der Ausgabe
Ihre Daten sehen gut aus, und Sie sind bereit, die Ausgabedatei zu generieren, um mit der Analyse in Tableau Desktop zu beginnen. Dazu müssen Sie nur Ihr Schema ausführen und Ihre Extraktdatei generieren. Dazu müssen Sie einen Schritt vom Typ Ausgabe hinzufügen.
Je nachdem, wo Sie arbeiten, können Sie Ihr Schema in einer Datei (nur Tableau Prep Builder), in einer veröffentlichten Datenquelle oder in einer Datenbank ausgeben.
Wählen Sie im Schemabereich den Eintrag Bestellungen+Rücksendungen bereinigen aus, klicken Sie auf das Pluszeichen und wählen Sie dann Ausgabe (bzw. Ausgabe hinzufügen in früheren Versionen) aus.
Beim Hinzufügen eines Ausgabeschritts wird der Bereich Ausgabe mit einem Snapshot Ihrer Daten geöffnet. Hier können Sie den zu generierenden Ausgabetyp auswählen und den Namen sowie den Speicherort der Datei angeben.
Das Standardverzeichnis befindet sich im Repository Mein Tableau Prep Builder im Ordner Ihrer Datenquellen.
Führen Sie im linken Bereich im Dropdown-Menü Ausgabe Speichern in einen der folgenden Schritte aus (je nachdem, wo Sie arbeiten):
Tableau Prep Builder
- Wählen Sie Datei aus (wählen Sie in früheren Versionen In Datei speichern aus).
- Klicken Sie auf die Schaltfläche Durchsuchen. Geben Sie dann im Dialogfeld Extrakt speichern unter einen Namen für die Datei ein, z. B. Bestellungen_Rücksendungen_Superstore, und klicken Sie auf Übernehmen.
Wählen Sie im Feld Ausgabetyp einen Ausgabetyp aus. Wählen Sie den Tableau-Datenextrakt (.hyper) für Tableau Desktop oder durch Komma getrennte Werte (.csv) aus, wenn Sie den Extrakt für einen Drittanbieter freigeben möchten.
Tableau Server oder Tableau Cloud
- Wählen Sie Veröffentlichte Datenquelle aus.
- Wählen Sie ein Projekt aus.
Geben Sie einen Namen für die Datei ein, z. B. Orders_Returns_Superstore.
Tipp: Beim Generieren der Ausgabe in Ihrem Schema haben Sie mehrere Möglichkeiten. Sie können eine Extraktdatei generieren (nur Tableau Prep Builder) oder Ihre Daten als Datenquelle in Tableau Server oder Tableau Cloud veröffentlichen. Alternativ können Sie Ihre Daten in eine Datenbank schreiben. Weitere Informationen zum Generieren von Ausgabedateien finden Sie unter Erstellen von Datenextraktdateien und veröffentlichten Datenquellen(Link wird in neuem Fenster geöffnet).
Zeigen Sie im Abschnitt Schreiboptionen die Optionen zum Schreiben der neuen Daten in Ihre Dateien an. Sie möchten die Standardeinstellung (Tabelle erstellen) verwenden und die Tabelle durch die Flow-Ausgabe ersetzen, sodass sich hier nichts ändern kann.
Tipp: Ab Version 2020.2.1 können Sie auswählen, wie Sie Ihre Flussdaten zurück in die Tabelle schreiben möchten. Sie können zwischen zwei Optionen wählen: Tabelle erstellen oder Tabelle anfügen. Standardmäßig verwendet Tableau Prep die Option Tabelle erstellen und überschreibt Ihre Tabellendaten mit den neuen Daten, wenn Sie das Schema ausführen. Wenn Sie Tabelle anhängen auswählen, fügt Tableau Prep die Schemadaten der vorhandenen Tabelle hinzu, sodass Sie für jede Schemaausführung sowohl neue als auch historische Daten nachverfolgen können. Weitere Informationen finden Sie unter Konfigurieren von Schreiboptionen.
Klicken Sie im Ausgabefenster auf Schemata ausführen oder auf die Schaltfläche Schemata ausführen im Bereich "Schema", um Ihre Ausgabe zu generieren.
Hinweis: Wenn Sie im Internet arbeiten, klicken Sie auf Veröffentlichen, um das Entwurfsschema zu veröffentlichen. Es können nur veröffentlichte Schemata ausgeführt werden.
Wenn die Ausführung des Schemas abgeschlossen ist, wird in einem Status-Dialogfeld zusätzlich zu der Ausführungsdauer angegeben, ob die Schemaausführung erfolgreich war. Klicken Sie auf Fertig, um das Dialogfeld zu schließen.
Wenn Sie im Internet arbeiten, navigieren Sie zur Seite Erkunden > Alle Schemata, und suchen Sie Ihr Schema. Sie können den Status Ihres Schemas auf der Seite "Schemaübersicht" anzeigen.
Um die Daten aktuell zu halten, können Sie das Schema manuell ausführen oder die Befehlszeile verwenden. Wenn Sie Tableau Data Management haben und Tableau Prep Conductor aktiviert ist, können Sie das Schema in Tableau Server oder Tableau Cloud auch nach einem Zeitplan ausführen.
Ab Tableau Prep Builder-Version 2020.2.1 und im Internet können Sie sämtliche Daten auch bei jeder Schemaausführung aktualisieren, oder Sie können das Schema mit einer inkrementellen Aktualisierung ausführen und jeweils nur die neuen Daten verarbeiten.
Weitere Informationen zum Verwalten Ihrer Lizenz finden Sie unter den folgenden Themen:
- Aktualisieren von Schema-Ausgabedateien über die Befehlszeile(Link wird in neuem Fenster geöffnet)
- Veröffentlichen eines Schemas in Tableau Server oder Tableau Cloud(Link wird in neuem Fenster geöffnet)
- Aktualisieren von Schemadaten mithilfe der inkrementellen Aktualisierung(Link wird in neuem Fenster geöffnet)
Nachbereitung und Ressourcen
Sie sind ein Superstar der Datenvorbereitung! Sie hatten unreine Daten und haben Sie mit Leichtigkeit umgewandelt! Innerhalb kürzester Zeit haben Sie Ihre Daten aus mehreren Datensätzen bereinigt, aufbereitet und sie in einen schlanken, reinen Datensatz konvertiert, sodass Sie nun damit in Tableau Desktop arbeiten können, um Ihre Analyse durchzuführen.
Sie möchten weiter üben? Wiederholen Sie den Rest des Beispielschemas für Superstore mithilfe der nachfolgend angegebenen Datendateien:
- Orders_South_2015
- Orders_South_2016
- Orders_South_2017
- Orders_South_2018
- Orders_Central
- Orders_East
- Orders_West
- returns_reasons_new
- Quota
Nach der Installation von Tableau Prep Builder befinden sich diese Dateien bereits im folgenden Verzeichnis auf Ihrem Computer:
- (Windows)
C:\Program Files\Tableau\Tableau Prep Builder <version>\help\Samples\en_US\Superstore Files
- (Mac)
/Applications/Tableau Prep Builder <version>.app/Contents/help/Samples/en_US/Superstore Files
Sie möchten eine weitere Schulung belegen? Werfen Sie einen Blick auf diese fantastischen Ressourcen(Link wird in neuem Fenster geöffnet), oder nehmen Sie an einem persönliche Schulungs(Link wird in neuem Fenster geöffnet)kurs teil.
Sie möchten weitere Informationen zu den behandelten Themen erhalten? Schlagen Sie unter den anderen Themen in der Tableau Prep-Online-Hilfe nach.