Erste Schritte in Tableau Prep Builder

Hinweis: In Version 2019.1.2 von Tableau Prep wurde der Name in Tableau Prep Builder geändert. In früheren Versionen des Produkts wird nach wie vor der Name "Tableau Prep" angezeigt.

Dieses Tutorial führt Sie in die allgemeinen Vorgehensweisen in Tableau Prep Builder ein. Anhand der in Tableau Prep Builder enthaltenen Beispieldatensätze erstellen Sie schrittweise ein Schema für einen Beispiel-Superstore. In diesem Tutorial wird die aktuellste Version von Tableau Prep Builder verwendet. Wenn Sie eine ältere Version verwenden, können Ihre Ergebnisse abweichen.

Beachten Sie in diesem Zusammenhang auch die Tipps zur Bereinigung und Vorbereitung Ihrer Daten für die Analyse mit Tableau Prep Builder.

Bevor Sie mit diesem Tutorial fortfahren, müssen Sie Tableau Prep Builder installieren. Informationen hierzu finden Sie unter Installieren von Tableau Desktop oder Tableau Prep Builder über die Benutzeroberfläche im Tableau Desktop- und Tableau Prep Builder-Bereitstellungshandbuch. Andernfalls können Sie die kostenlose Testversion herunterladen.

Beispieldateien

Hinweis: Zur Durchführung dieses Tutorials müssen Sie Tableau Prep Builder installieren und die folgenden Datendateien für das Superstore-Beispiel in ein Verzeichnis herunterladen:

Nach der Installation von Tableau Prep Builder befinden sich diese Dateien bereits im folgenden Verzeichnis auf Ihrem Computer:

  • (Windows) C:\Program Files\Tableau\Tableau Prep Builder <version>\help\Samples\en_US\Superstore Files
  • (Mac) /Applications/Tableau Prep Builder <version>.app/Contents/help/Samples/en_US/Superstore Files
  • Und das ist die Geschichte ...

    Sie arbeiten in der Hauptniederlassung für eine große Einzelhandelskette. Ihr Chef möchte die Produktumsätze und Gewinne des Unternehmens für die letzten drei Jahre analysieren. Sie schlagen vor, dafür Tableau Desktop zu verwenden. Ihr Chef findet diese Idee großartig und möchte, dass Sie sich darum kümmern.

    Während Sie alle benötigten Daten sammeln, bemerken Sie, dass die Daten für die einzelnen Regionen auf unterschiedliche Art und Weise erfasst und überwacht wurden. Zudem fällt Ihnen auf, dass die verschiedenen Dateien viele kreative Dateneingaben beinhalten und dass eine Region sogar über eine separate Datei für jedes Jahr verfügt!

    Bevor Sie mit der Datenanalyse in Tableau beginnen können, müssen Sie zunächst eine gründliche Datenbereinigung durchführen. Ihnen steht eine lange Nacht bevor.

    Während Sie die Speisekarten von Restaurants durchblättern, um sich ein Abendessen zu bestellen, fällt Ihnen ein, dass Tableau kürzlich das neue Produkt Tableau Prep Builder auf den Markt gebracht hat.

    Sie registrieren sich für eine kostenlose Testversion und probieren Sie aus.

    1. Herstellen einer Verbindung zu Daten

    Wenn Sie Tableau Prep Builder öffnen, wird wie in Tableau Desktop zuerst eine Startseite mit dem Bereich Verbindungen angezeigt.

    Im ersten Schritt stellen Sie eine Verbindung zu Ihren Daten her und erstellen einen Eingabeschritt. Dieser dient als Ausgangspunkt für die Erstellung eines Workflows oder "Schemas", so die Bezeichnung in Tableau Prep Builder. Im weiteren Verlauf fügen Sie weitere Schritte hinzu, um Aktionen für Ihre Daten auszuführen.

    Tipp: Der Eingabeschritt ist der Erfassungspunkt für Ihre Daten und der Ausgangspunkt für Ihr Schema. Sie können mehrere Eingabeschritte verwenden, und einige Eingabeschritte können mehrere Datendateien beinhalten. Weitere Informationen zum Herstellen einer Verbindung zu Daten finden Sie unter Herstellen einer Verbindung zu Daten.

    Ihre Vertriebsdatendateien für die verschiedenen Regionen sind in verschiedenen Formaten gespeichert, und bei den Aufträgen aus dem Süden handelt es sich in der Tat um mehrere Dateien. Sie sehen sich den Bereich Verbindungen an und stellen fest, dass Sie viele Möglichkeiten zum Herstellen einer Verbindung zu Daten haben. Großartig!

    Da die anderen Regionen über eine einzelne Datei mit Daten für alle vier Jahre verfügen, entscheiden Sie, sich die Dateien aus dem Süden zuerst vorzunehmen.

    1. Klicken Sie im Bereich Verbindungen auf die Schaltfläche Verbindung hinzufügen.

    2. Bei den Dateien handelt es sich um CSV-Dateien. Wählen Sie daher in der Verbindungsliste den Eintrag Textdatei aus.

    3. Navigieren Sie zu dem Verzeichnis für Ihre Dateien, wählen Sie die erste Datei orders_south_2015.csv aus, und klicken Sie auf Öffnen, um sie Ihrem Schema hinzuzufügen. (Informationen zum Dateispeicherort finden Sie unter Nachbereitung und Ressourcen.)

      Nachdem Sie eine Verbindung zu Ihrer ersten Datei hergestellt haben, wird der Tableau Prep Builder-Arbeitsbereich geöffnet, und Sie sehen, dass er in zwei Hauptbereiche unterteilt ist. Oben befindet sich der Bereich Schema, und unten ist der Bereich Eingabe angeordnet.

      Der Bereich Schema in Tableau Prep Builder ist Ihr Arbeitsbereich ähnlich dem von Tableau Desktop, in dem Sie visuell mit Ihren Daten interagieren und Ihr Schema erstellen können. Der Bereich Eingabe enthält Konfigurationsoptionen zur Erfassung der Daten. Zudem werden dort die Felder, Datentypen und Beispielwerte aus Ihrem Datensatz angezeigt.

      Im nächsten Abschnitt erfahren Sie, wie Sie mit diesen Daten interagieren können.

      Tipp: Bei einzelnen Tabellen erstellt Tableau Prep Builder im Bereich Schema automatisch einen Eingabeschritt, wenn Sie Ihrem Schema Daten hinzufügen. Andernfalls können Sie dem Bereich Schema per Drag & Drop Tabellen hinzufügen.

    4. Für Aufträge aus dem Süden verfügen Sie über drei weitere Dateien. Sie könnten die Dateien einzeln hinzufügen, möchten jedoch alle Dateien in einem Eingabeschritt kombinieren. Dazu klicken Sie im Bereich Eingabe auf die Registerkarte Mehrere Dateien.

    5. Es wird eine Option für die Platzhaltervereinigung angezeigt. Wählen Sie sie aus.

      Sie stellen fest, dass das Verzeichnis, in dem Sie Ihre Datei ausgewählt haben, bereits ausgefüllt ist und dass die anderen von Ihnen benötigten Dateien im Abschnitt Enthaltene Dateien im Bereich "Eingabe" aufgelistet sind.

      Tipp: Die Platzhaltervereinigung eignet sich hervorragend, um mehrere Dateien aus einer einzelnen Datenquelle mit ähnlichem Namen und ähnlicher Struktur zusammenzuführen und eine Verbindung dazu herzustellen. Wenn Sie diese Option verwenden möchten, müssen sich die Dateien in demselben unter- oder übergeordneten Verzeichnis befinden. Wenn die benötigten Dateien nicht angezeigt werden, ändern Sie die Suchkriterien. Weitere Informationen dazu finden Sie unter Vereinigen von Dateien und Datenbanktabellen im Schritt "Eingabe".

    6. Klicken Sie auf Übernehmen, um die Daten aus diesen Dateien dem Eingabeschritt orders_south_2015 hinzuzufügen.

    7. Bei den Dateien für die anderen Regionen handelt es sich ausschließlich um einzelne Tabellendateien, sodass Sie alle Dateien gleichzeitig auswählen und sie Ihrem Schema hinzufügen können.

    8. Öffnen Sie den Datei-Explorer oder Finder, und navigieren Sie zu dem Verzeichnis für die Dateien. Wählen Sie die folgenden Dateien per Strg-Klick (Befehlstaste-Klick bei MacOS) aus, und verschieben Sie sie per Drag & Drop in den Bereich Schema, um sie Ihrem Schema hinzuzufügen. (Informationen zum Dateispeicherort finden Sie unter Nachbereitung und Ressourcen.)

      • Orders_Central.csv
      • Orders_East.xlsx
      • Orders_West.csv

      Hinweis: Dies sind verschiedene Dateitypen. Wenn nicht all diese Dateien angezeigt werden, stellen Sie sicher, dass in Ihrem Datei-Explorer oder Finder die Anzeige aller Dateitypen festgelegt ist.

    Kontrollieren Sie Ihre Arbeit: Sehen Sie das "Herstellen einer Verbindung zu Daten" in Aktion.

    Klicken Sie zur erneuten Wiedergabe auf das Bild.

    2. Untersuchen von Daten

    Nachdem Sie die Datendateien nun in Tableau Prep Builder geladen haben, möchten Sie sicherlich die Dateien miteinander kombinieren. Zuvor empfiehlt es sich jedoch, sie zunächst zu überprüfen, um mögliche Probleme ausfindig zu machen.

    Wenn Sie im Bereich Schema einen Eingabeschritt auswählen, werden die Einstellungen zum Erfassen der Daten, die enthaltenen Felder und einige Beispielwerte angezeigt.

    Sie sollten nun entscheiden, wie viele Daten Sie in das Schema einbeziehen möchten, und Sie sollten nicht benötigte Felder entfernen oder filtern. Sie können auch Datentypen ändern, die falsch zugeordnet wurden.

    Tipp: Wenn Sie mit großen Datensätzen arbeiten, fügt Tableau Prep Builder automatisch eine Stichprobe der Daten hinzu, um die Leistung zu maximieren. Wenn die erwarteten Daten nicht angezeigt werden, müssen Sie die Stichprobe möglicherweise anpassen. Dazu können Sie die Registerkarte Stichprobe verwenden. Weitere Informationen zum Konfigurieren Ihrer Datenoptionen und Stichprobengröße finden Sie unter Festlegen der Stichprobengröße.

    Während Sie im Bereich Schema die einzelnen Schritte auswählen und sämtliche Datensätze überprüfen, fallen Ihnen einige Dinge auf, die Sie später korrigieren möchten. Zudem bemerken Sie einen Aspekt, den Sie jetzt im Schritt Eingabe berichtigen können.

    • Klicken Sie im Bereich Schema auf den Eingabeschritt Orders_Central, um ihn auszuwählen. Im Bereich Eingabe fallen Ihnen die folgenden Probleme auf:

      • Die Bestell- und Liefertermine sind in Felder für Monat, Tag und Jahr unterteilt.

      • Einige Felder weisen andere Datentypen auf als dieselben Felder in anderen Dateien.

      • Es existiert kein Feld für die Region.

      Sie müssen diese Felder bereinigen, bevor Sie diese Datei mit den anderen Dateien kombinieren können. Dies ist jedoch hier im Schritt Eingabe nicht möglich. Sie machen sich daher eine Notiz, um sich später darum zu kümmern.

    • Wählen Sie den Eingabeschritt Orders_East aus.

      Die Felder in dieser Datei lassen sich offensichtlich problemlos mit den anderen Dateien kombinieren. Scheinbar ist jedoch in allen Werten für den Umsatz der Währungscode enthalten. Dies müssen Sie später ebenfalls korrigieren.

    • Wählen Sie den Eingabeschritt Orders_West aus. Diese Datei enthält ebenfalls einige Probleme.

      • Im Feld Bundesstaat werden Abkürzungen für den Namen des Bundesstaats verwendet. In anderen Dateien wird er ausgeschrieben. Dies müssen Sie später korrigieren.

      • Mehrere Felder beginnen mit Right_. Bei diesen Feldern handelt es sich scheinbar um Duplikate der anderen Felder. Diese Duplikate sollten Sie nicht in das Schema einbeziehen. Sie können dies hier im Schritt Eingabe korrigieren:

        Wenn Sie dieses Problem jetzt beheben möchten, deaktivieren Sie das Kontrollkästchen für alle Felder, die mit Right_ beginnen. Dadurch ignoriert Tableau Prep Builder diese Felder, und sie werden nicht in das Schema einbezogen.

        Tipp: Beim Ausführen von Bereinigungsvorgängen in einem Schritt, beispielsweise beim Entfernen von Feldern, überwacht Tableau Prep Builder Ihre Änderungen im Bereich Anpassungen und fügt eine Anmerkung (in Form eines kleinen Symbols) im Schemabereich hinzu, um Ihnen beim Nachverfolgen der Aktionen zu helfen, die Sie für Ihre Daten ausführen. Bei Eingabeschritten wird zudem jedem Feld eine Anmerkung hinzugefügt.

        Ab Tableau Prep Builder-Version 2018.3.1 sind in den meisten Schritten Ihres Schemas Bereinigungsvorgänge verfügbar. In vorherigen Versionen müssen die meisten Bereinigungsvorgänge in einem Bereinigungsschritt durchgeführt werden.

    Da Sie nun einige Problemstellen in Ihren Datensätzen identifiziert haben, untersuchen Sie im nächsten Schritt die Daten etwas genauer und bereinigen die gefundenen Probleme, sodass Sie Ihre Daten kombinieren und formen sowie eine Ausgabedatei generieren können, die für die Analyse verwendet werden kann.

    3. Bereinigen von Daten

    Das Untersuchen und Bereinigen von Daten in Tableau Prep Builder ist ein iterativer Prozess. Nachdem Sie sich für einen Datensatz entschieden haben, mit dem Sie arbeiten möchten, untersuchen Sie im nächsten Schritt diese Daten, und Sie führen verschiedene Aktionen aus, indem Sie diverse Bereinigungs-, Formungs- und Kombinierungsvorgänge darauf anwenden. Sie wenden diese Vorgänge an, indem Sie Ihrem Schema Schritte hinzufügen. Weitere Informationen zu den Bereinigungsoptionen in Tableau Prep Builder finden Sie unter Bereinigen und Formen von Daten.

    Je nachdem, was Sie tun möchten, gibt es verschiedene Schritte. Fügen Sie beispielsweise einen Bereinigungsschritt hinzu (Schritt hinzufügen), wenn Sie Bereinigungsvorgänge wie Filtern, Zusammenführen, Teilen, Umbenennen usw. auf Ihre Felder anwenden möchten. Fügen Sie einen Aggregationsschritt hinzu, um Felder zu gruppieren und zu aggregieren und die Detailstufe Ihrer Daten zu ändern. Weitere Informationen zu den verschiedenen Schritttypen und ihrer Anwendung finden Sie unter Erstellen und Organisieren Sie Ihr Schema.

    Tipp: Beim Hinzufügen von Schritten zu Ihrem Schema wird automatisch eine Schemalinie hinzugefügt, um die Schritte miteinander zu verbinden. Sie können diese Schemalinien verschieben und nach Bedarf entfernen oder hinzufügen.

    Beim Ausführen des Schemas sind diese Verbindungspunkte erforderlich, damit Tableau Prep Builder weiß, welche Schritte miteinander verbunden sind und in welcher Reihenfolge die Schritte im Schema angewendet werden. Wenn eine Schemalinie fehlt, wird das Schema unterbrochen, und Sie erhalten eine Fehlermeldung.

    Bereinigen von "Orders_Central"

    Um die zuvor erkannten Probleme zu beheben und zu prüfen, ob weitere Probleme vorliegen, fügen Sie zunächst dem Eingabeschritt Orders_Central einen Bereinigungsschritt hinzu.

    1. Wählen Sie im Bereich Schema den Eintrag Orders_Central aus, klicken Sie auf das Pluszeichen und wählen Sie "Schritt hinzufügen" aus. Je nach Version lautet diese Menüoption Schritt hinzufügen, Clean Step hinzufügen oder Schritt bereinigen.

      Wenn Sie Ihrem Schema einen Bereinigungsschritt hinzufügen, ändert sich der Arbeitsbereich, und es werden die Details zu Ihren Daten angezeigt.

      A. Bereich "Schema", B. Symbolleiste, C. Bereich "Profil", D. Datenraster

      Der Arbeitsbereich wird nun in drei Teile aufgeteilt: in den Bereich Schema, den Bereich Profil mit einer Symbolleiste und in das Raster Daten.

      Im Bereich Profil wird die Struktur Ihrer Daten angezeigt. Dabei werden die Feldwerte in Partitionen zusammengefasst, sodass Sie die zugehörigen Werte schnell zuordnen und Ausreißer und Nullwerte erkennen können. Im Raster Daten werden die Zeilenebenendetails für Ihre Felder angezeigt.

      Tipp: Alle Felder im Bereich Profil werden auf einer Profilkarte angezeigt. Mithilfe des Menüs Weitere Optionen (in vorherigen Versionen waren dies Drop-down-Pfeile) auf den einzelnen Karten können Sie die verschiedenen Bereinigungsoptionen anzeigen und auswählen, die für den jeweiligen Feldtyp verfügbar sind. Sie können die Feldwerte auch sortieren, den Datentyp ändern, dem Feld eine Datenrolle zuordnen oder die Profilkarten und Spalten im Raster Daten per Drag-and-Drop verschieben, um sie neu anzuordnen.

      Bereinigen von Daten mit berechneten Feldern

      In diesem Datensatz fehlt ein Feld für die Region. Da dieses Feld in den anderen Datensätzen enthalten ist, müssen Sie es hinzufügen, damit Sie Ihre Daten später kombinieren können. Dazu müssen Sie ein berechnetes Feld verwenden.

    2. Klicken Sie in der Symbolleiste auf Berechnetes Feld erstellen.

    3. Benennen Sie im Berechnungseditor das berechnete Feld Region. Geben Sie dann "Central" (mit den Anführungszeichen) ein, und klicken Sie auf Speichern.

      Sie schätzen die Flexibilität hinsichtlich der Möglichkeit, Ihre Daten mithilfe von berechneten Feldern zu formen. Sie stellen begeistert fest, dass der Berechnungs-Editor von Tableau Prep Builder dieselbe Sprache verwendet wie derjenige von Tableau Desktop.

      Tipp: Änderungen, die Sie an den Feldern und Werten vornehmen, werden im Anpassungsbereich von Tableau Prep Builder überwacht. Zudem wird dem Bereinigungsschritt im Schema und dem Feld im Bereich Profil ein Symbol (Anmerkung) hinzugefügt, das auf die Änderung hindeutet. Wir werden uns den Anpassungsbereich ansehen, nachdem wir weitere Änderungen vorgenommen haben.

      Im nächsten Schritt kümmern Sie sich um die separaten Felder für das Bestell- und Lieferdatum. Sie möchten sie in zwei einzelnen Feldern kombinieren, und zwar in einem Feld für das Bestelldatum und in einem Feld für das Lieferdatum, damit sie mit denselben Feldern in den anderen Datensätzen übereinstimmen. Wenn Sie sicherstellen, dass Ihre Tabellen die gleichen Felder haben, können Sie die Tabellen später mit einer Vereinigung kombinieren.

      Sie können auch hier wieder ein berechnetes Feld verwenden, um dies in einem einfachen Schritt zu erledigen.

    4. Klicken Sie in der Symbolleiste auf Berechnetes Feld erstellen, um die Felder Jahr der Bestellung, Monat der Bestellung, und Tag der Bestellung in einem Feld mit dem Format "MM/TT/JJJJ" zu kombinieren.

    5. Benennen Sie im Berechnungseditor das berechnete Feld Bestelldatum. Geben Sie dann die folgende Berechnung ein und klicken Sie auf Speichern:

      MAKEDATE([Order Year],[Order Month],[Order Day])

      Sie verfügen nun über ein neues Feld für das Bestelldatum und möchten die vorhandenen Felder entfernen, da Sie sie nicht mehr benötigen.

      Der Bereich Profil enthält viele Felder. Sie sehen, dass in der oberen rechten Ecke der Symbolleiste ein Suchfeld vorhanden ist. Sie fragen sich, ob Sie damit kurzerhand die Felder suchen können, die Sie entfernen möchten. Sie probieren es aus.

    6. Geben Sie im Bereich Profil im Suchfeld den Eintrag Bestellung ein.

      Tableau Prep Builder sucht nach allen Feldern, deren Name das Wort Bestellung enthält und zeigt diese schon bald an. Großartig!

    7. Wählen Sie per Strg-Klick (Befehlstaste-Klick bei MacOS) die Felder für Jahr der Bestellung, Monat der Bestellung und Tag der Bestellung aus. Klicken Sie dann mit der rechten Maustaste auf die ausgewählten Felder, und wählen Sie im Menü die Option Entfernen (Feld entfernen in früheren Versionen) aus, um sie zu entfernen.

    8. Wiederholen Sie nun die Schritte 4 bis 7 oben, um ein einzelnes Feld für das Lieferdatum zu erstellen. Versuchen Sie es selbst, oder verwenden Sie die folgenden Schritte als Hilfe.

      • Klicken Sie in der Symbolleiste auf Berechnetes Feld erstellen, um die Felder Jahr der Lieferung, Monat der Lieferung, und Tag der Lieferung in einem Feld mit dem Format "MM/TT/JJJJ" zu kombinieren.

      • Geben Sie dem berechneten Feld den Namen Lieferdatum, und geben Sie die Berechnung MAKEDATE([Ship Year],[Ship Month],[Ship Day]) ein. Klicken Sie anschließend auf Speichern.

      • Entfernen Sie die Felder Jahr der Lieferung, Monat der Lieferung und Tag der Lieferung. Suchen Sie nach den Feldern, wählen Sie sie aus und wählen Sie Entfernen (Feld entfernen in früheren Versionen) aus dem Menü, um die Felder zu entfernen.

      Tipp: Tableau Prep Builder fasst die Daten im Profilbereich in Partitionen zusammen, damit Sie die Form der Daten schnell erkennen, Ausreißer finden, Beziehungen zwischen den Feldern nachvollziehen können usw.

      In diesem Szenario können die Bestell- und Liefertermine nun nach Jahr zusammengefasst werden. Jede Partition repräsentiert ein Jahr vom Januar des ersten Jahres bis zum Januar des Folgejahres und ist entsprechend beschriftet. Da einige Bestell- und Liefertermine auf den späteren Abschnitt der Jahre 2018 und 2019 fallen, erhalten wir eine Partition für diese Daten, die entsprechend mit Jahresende 2019 und 2020 beschriftet ist.

      Wenn Sie diese Ansicht in das Ist-Datum ändern möchten, klicken Sie auf der Profilkarte auf das Menü Weitere Optionen (in früheren Versionen war dies ein Dropdown-Pfeil), und wählen Sie Detail aus.

      Direktes Interagieren mit Feldern zum Bereinigen der Daten

      Ihre Daten nehmen langsam Form an. Als Sie mit dem Entfernen der zusätzlichen Felder für die Bestell- und Liefertermine fertig sind, bemerken Sie einige Probleme mit dem Feld Rabatte.

      • Es ist dem Datentyp Zeichenfolge anstatt Zahl (Dezimalzahl) zugeordnet.

      • Anstatt eines numerischen Werts für keinen Rabatt existiert der Feldwert Keine.

      Dies führt zu einem Problem beim Kombinieren der Dateien, daher sollten Sie dies ebenfalls korrigieren.

    9. Löschen Sie Ihre Suche, und geben Sie Rab in das Suchfeld ein, um das Feld zu suchen.

    10. Wählen Sie das Feld Rabatte aus, doppelklicken Sie auf den Feldwert Keine, und ändern Sie ihn in den numerischen Wert 0.

    11. Um den Datentyp für das Feld Rabatt von Zeichenfolge in Zahl (Dezimalzahl) zu ändern, klicken Sie auf Abc und wählen Sie im Dropdown-Menü die Option Zahl (Dezimalzahl) aus.

    12. Benennen Sie schlussendlich den Schritt, um Ihre Aktionen in diesem Schritt besser nachvollziehen zu können. Doppelklicken Sie im Bereich Schema auf den Schrittnamen Bereinigen 1, und geben Sie Termine/Feldnamen korrigieren ein.

    Überprüfen der Änderungen

    Sie haben an diesem Datensatz viele Änderungen vorgenommen und machen sich Sorgen, dass Sie sich nicht mehr an alles erinnern können, was Sie getan haben. Während Sie Ihre Arbeit prüfen, fällt Ihnen links im Bereich Profil die Spalte Änderungen auf.

    Sie klicken auf den Pfeil, um sie zu öffnen, und Sie sehen eine Liste mit allen Änderungen, die Sie gerade vorgenommen haben. Während Sie einen Bildlauf durch die Änderungen in der Liste durchführen, bemerken Sie, dass Sie Ihre Änderungen löschen oder bearbeiten und sogar verschieben können, um die Reihenfolge zu ändern, in der sie vorgenommen wurden.

    Sie sind begeistert davon, dass Sie die in den Schritten vorgenommenen Änderungen beim Erstellen des Schemas problemlos finden und mit der Reihenfolge dieser Änderungen experimentieren können, um Ihre Daten optimal zu nutzen.

    Kontrollieren Sie Ihre Arbeit: Sehen Sie das "Bereinigen von Orders_Central" in Aktion.

    Klicken Sie zur erneuten Wiedergabe auf das Bild.

    Da Sie nun eine Datei bereinigt haben, sehen Sie sich die anderen Dateien an, um zu prüfen, welche weiteren Probleme Sie beheben müssen.

    Sie sehen sich als Nächstes die Excel-Datei für Orders_East an.

    Bereinigen von "Orders_East"

    Während Sie die Felder der Datei Orders_East prüfen, stimmen mit Ausnahme des Feldes Umsatz die meisten Felder offenbar mit den anderen Dateien überein. Um sich dies genauer anzusehen und zu prüfen, ob weitere Probleme gelöst werden müssen, fügen Sie dem Eingabeschritt Orders_East einen Bereinigungsschritt hinzu.

    1. Wählen Sie im Bereich Schema den Eintrag Orders_East aus, klicken Sie auf das Pluszeichen und fügen Sie einen Bereinigungsschritt hinzu. Je nach Version lautet diese Menüoption Schritt hinzufügen, Bereinigungsschritt hinzufügen oder Bereinigungsschritt.

      Während Sie das Feld Umsatz prüfen, stellen Sie schnell fest, dass der Währungscode USD in die Umsatzzahlen eingefügt wurde und dass Tableau Prep Builder diese Feldwerte als Zeichenfolge interpretiert hat.

      Sie müssen den Währungscode aus diesem Feld entfernen und den Datentyp ändern, wenn Sie exakte Vertriebsdaten haben möchten.

      Sie haben bereits gelernt, wie sich der Datentyp problemlos korrigieren lässt. Es liegen jedoch mehr als 2000 eindeutige Zeilen mit Umsatzdaten vor, und eine Korrektur der einzelnen Zeilen, um den Währungscode zu entfernen, scheint sehr mühsam.

      Sie haben jedoch Tableau Prep Builder und sehen im Dropdown-Menü nach, ob es eine Option zur Behebung dieses Problems gibt.

      Wenn Sie auf die Option Weitere Optionen (Dropdown-Pfeil in früheren Versionen) für das Feld Vertrieb klicken, sehen Sie eine Menüoption namens Bereinigen und darunter eine Option zum Entfernen von Buchstaben. Sie probieren sie aus, um den Effekt zu testen.

    2. Wählen sie das Feld Umsatz aus. Klicken Sie auf das Menü Weitere Optionen (in vorherigen Versionen waren dies Drop-down-Pfeile) und wählen Sie Bereinigen > Buchstaben entfernen aus.

      Toll! Diese Bereinigungsoption hat den Währungscode direkt aus allen Feldern entfernt. Jetzt müssen Sie lediglich den Datentyp von Zeichenfolge in Zahl (Dezimalzahl) ändern, damit die Datei ordentlich aussieht.

    3. Klicken Sie auf den Datentyp für das Feld Umsatz und wählen Sie Zahl (dezimal) aus der Dropdown-Liste, um den Datentyp zu ändern.

    4. Der Rest der Datei sieht recht ordentlich aus. Benennen Sie den Bereinigungsschritt, um Ihre Arbeit nachverfolgen zu können. Beispiel: Datentyp ändern.

    Als Nächstes sehen Sie sich die letzte Datei für Orders_West an, um sie auf Probleme zu prüfen, die Sie beheben müssen.

    Bereinigen von "Orders_West"

    Während Sie die Felder für die Datei Orders_West prüfen, stimmen die meisten Felder scheinbar mit den anderen Dateien überein. Sie erinnern sich jedoch daran, dass im Feld Bundesstaaten Abkürzungen für die Werte verwendet wurden, anstatt den Namen des Bundesstaats auszuschreiben. Wenn Sie diese Datei mit den anderen Dateien kombinieren möchten, müssen Sie dieses Problem beheben. Sie fügen daher dem Eingabeschritt Orders_West einen Bereinigungsschritt hinzu.

    1. Wählen Sie im Bereich Schema den Eintrag Orders_West aus, klicken Sie auf das Pluszeichen und fügen Sie einen Bereinigungsschritt hinzu.

      Führen Sie einen Bildlauf durch, oder verwenden Sie die Suche, um das Feld Bundesstaat zu suchen. Sie stellen fest, dass für alle Bundesstaatenwerte die Kurzform der Abkürzung verwendet wird. Für dieses Feld sind nur 11 eindeutige Werte vorhanden. Sie könnten sie manuell einzeln ändern, aber vielleicht gibt es in Tableau Prep Builder eine andere Methode?

      Wenn Sie für dieses Feld auf das Menü Weitere Optionen (in vorherigen Versionen war dies der Dropdown-Pfeil) klicken, sehen Sie die Option Werte gruppieren (Gruppieren und Ersetzen in früheren Versionen). Wenn Sie sie auswählen, werden verschiedene Optionen angezeigt:

      • Manuelle Auswahl

      • Aussprache

      • Gemeinsame Zeichen

      • Schreibweise

      Die Namen der Bundesstaaten klingen nicht gleich, sind nicht falsch geschrieben und haben nicht dieselben Zeichen. Daher entscheiden Sie sich für die Option Manuelle Auswahl.

      Tipp: Sie können auf einen Feldnamen oder Feldwert doppelklicken, um einen einzelnen Wert zu bearbeiten. Wenn Sie mehrere Werte bearbeiten möchten, können Sie alle Werte auswählen und die Kontextmenü-Option Werte bearbeiten verwenden. Falls Sie jedoch speziellen Werten einen oder mehrere Werte zuordnen möchten, verwenden Sie die Option Werte gruppieren aus dem Dropdown-Menü.
      Für weitere Informationen zum Filtern und Gruppieren von Werten, siehe Feldwerte bearbeiten.

    2. Wählen sie das Feld Bundesstaat aus. Klicken Sie auf den Dropdown-Pfeil und wählen Sie Gruppieren und Ersetzen > Manuelle Auswahl aus.

      Eine Karte mit zwei Spalten wird geöffnet. Dies ist der Editor zum Gruppieren von Werten. In der Spalte auf der linken Seite werden die aktuellen Feldwerte angezeigt, während in der Spalte auf der rechten Seite die Felder angezeigt werden, die für die Zuordnung zu den Feldern auf der linken Seite verfügbar sind.

      Sie möchten die Abkürzungen der Bundesstaaten der ausgeschriebenen Version des Bundesstaatnamens zuordnen, diese Werte sind jedoch im Datensatz Orders_West nicht enthalten. Sie fragen sich, ob Sie einfach den Namen direkt bearbeiten und dort einfügen können und probieren es aus.

    3. Doppelklicken Sie im Editor zum Gruppieren und Ersetzen im linken Bereich auf AZ, um den Wert zu markieren, und geben Sie Arizona ein. Drücken Sie dann die Eingabetaste, um Ihre Änderung hinzuzufügen.

      Tableau Prep Builder hat einen Zuordnungswert für den neuen Wert Arizona erstellt und ihm automatisch den alten Wert AZ zugeordnet. Die Einrichtung einer Zuordnungsbeziehung für diese Werte spart Zeit, wenn Sie auf diese Art und Weise weitere Daten aus dieser Region eingeben.

      Tipp: Sie können Feldwerte hinzufügen, die nicht in Ihrer Stichprobe enthalten sind, um Zuordnungsbeziehungen zum Organisieren Ihrer Daten einzurichten. Wenn Sie Ihre Datenquelle aktualisieren und neue Daten hinzugefügt werden, können Sie die neuen Daten der Zuordnung hinzufügen, anstatt die einzelnen Werte manuell zu korrigieren.

      Beim manuellen Hinzufügen eines Werts, der nicht in Ihrer Stichprobe enthalten ist, wird der Wert mit einem roten Punkt markiert, sodass sie ihn leicht identifizieren können.

    4. Wiederholen Sie diese Schritte, um die einzelnen Bundesstaaten der ausgeschriebenen Version des zugehörigen Namens zuzuordnen.

      Abkürzung Name des Bundesstaats
      AZ Arizona
      CA Kalifornien
      CO Colorado
      ID Idaho
      MT Montana
      NM Neumexiko
      NV Nevada
      OR Oregon
      UT Utah
      WA Washington
      WY Wyoming

      Klicken Sie dann auf Fertig, um den Editor zum Gruppieren und Ersetzen zu schließen.

      Nachdem alle Bundesstaaten zugeordnet wurden, überprüfen Sie im Anpassungsbereich, ob statt 11 Einträgen nur noch ein Eintrag vorhanden ist.

      Scheinbar gruppiert Tableau Prep Builder ähnliche Aktionen für ein Feld zusammen. Das kommt Ihnen entgegen, da Sie somit an Ihrem Datensatz vorgenommene Änderungen später leichter finden können.

      Die Korrektur der Feldwerte für den Bundesstaat war die einzige Änderung, die Sie an dieser Stelle vornehmen mussten.

    5. Benennen Sie den Bereinigungsschritt, um Ihre Arbeit nachverfolgen zu können. Beispiel: Bundesstaaten umbenennen.

    Sie haben in Ihren Dateien viele Bereinigungen durchgeführt und können gar nicht glauben, wie schnell und einfach das war. Vielleicht schaffen Sie es doch noch zum Abendessen nach Hause! Speichern Sie Ihr Schema, um sicherzustellen, dass Ihre bisherige Arbeit nicht verloren geht.

    Klicken Sie auf Datei > Speichern oder auf Datei > Speichern unter. Speichern Sie Ihre Datei als Schemadatei (.tfl), und benennen Sie sie. Beispiel: Mein Superstore.

    Tipp: Sie können Ihre Schemadateien als Schemadatei (.tfl) oder als gepackte Datei (.tflx) speichern und Ihre lokalen Datendateien darin packen, um das Schema und die Dateien für andere Personen freizugeben. Weitere Informationen zum Speichern und Freigeben von Schemen finden Sie unter Speichern und Freigeben Ihrer Arbeit.

    4. Kombinieren von Daten

    Sie haben nun alle Dateien bereinigt und können sie kombinieren.

    Da alle Dateien nach der Bereinigung ähnliche Felder haben, müssen Sie die Tabellen vereinigen, um alle Zeilen in einer einzigen Tabelle zusammenzufassen.

    Sie erinnern sich an die Schrittoption Vereinigung hinzufügen, fragen sich jedoch, ob Sie die Schritte einfach per Drag-and-Drop verschieben können, um sie zu vereinigen. Sie probieren es aus.

    Vereinigen von Daten

    1. Ziehen Sie im Fenster Schema den vorletzten Bereinigungsschritt auf den letzten Bereinigungsschritt in Ihrem Schema und legen Sie ihn unter der Option Vereinigen ab. Ziehen Sie beispielsweise den Bereinigungsschritt Bundesstaaten umbenennen zum BereinigungsschrittDatentyp ändern, und legen Sie ihn unter der Option Vereinigen ab.

      Sie stellen fest, dass Tableau Prep Builder Ihrem Schema den neuen Schritt Vereinigung hinzugefügt hat. Großartig! Nun möchten Sie dieser Vereinigung auch die anderen Dateien hinzufügen.

    2. Ziehen Sie den zweiten Reinigungsschritt im Schema auf den neuen Schritt Daten/Feldnamen beheben auf den neuen Schritt Vereinigen und legen Sie ihn dann auf Hinzufügen ab, um ihn zur bestehenden Vereinigung hinzuzufügen.

    3. Ziehen Sie den Schritt orders_south_2015 zu dem neuen Schritt Vereinigung. Legen Sie ihn unter Hinzufügen ab, um ihn der vorhandenen Vereinigung hinzuzufügen.

      All Ihre Dateien werden nun in einer einzelnen Tabelle kombiniert. Wählen Sie im Bereich Schema den Schritt Vereinigung aus, um die Ergebnisse zu prüfen.

      Sie stellen fest, dass Tableau Prep Builder die Felder mit identischen Namen und Typen automatisch zugeordnet hat.

      Zudem bemerken Sie, dass die Farben, die den Schritten im Schema zugeordnet waren, in den Vereinigungsprofilen verwendet werden. Dadurch wird deutlich, woher das Feld stammt. Zudem werden sie in dem Farbband an der Oberkante der einzelnen Felder angezeigt, um Sie darüber zu informieren, ob das jeweilige Feld in der betreffenden Tabelle vorhanden ist.

      Sie sehen, dass das neue Feld Tabellennamen hinzugefügt wurde. Darin werden die Tabellen aufgelistet, aus denen alle Zeilen in der Vereinigung stammen.

      Im Zusammenfassungsbereich wird zudem eine Liste mit nicht übereinstimmenden Feldern angezeigt, und Sie sehen sofort, dass die Felder Produkt und Rabatte nur in der Datei Orders_Central erscheinen.

    4. Um diese Felder genauer zu untersuchen, aktivieren Sie im Bereich Union Results das Kontrollkästchen Nur nicht übereinstimmende Felder anzeigen.

      Bei der Überprüfung des Datenfelds stellen Sie schnell fest, dass zwar die Daten identisch sind, die Feldnamen jedoch voneinander abweichen. Sie könnten das Feld einfach umbenennen, fragen sich jedoch, ob Sie diese Felder einfach per Drag-and-Drop verschieben können, um sie zusammenzuführen. Sie probieren es aus.

    5. Wählen Sie das Feld Produkt aus, und ziehen Sie es per Drag-and-Drop auf das Feld Produktname, um die Felder zusammenzuführen. Nach dem Zusammenführen der Felder werden sie nicht mehr in dem Bereich angezeigt.

    6. Wiederholen Sie diesen Schritt, um das Feld Rabatte mit dem Feld Rabatt zusammenzuführen.

      Das einzige Feld, für das noch keine Übereinstimmung vorliegt, ist das Feld Dateipfade. In diesem Feld werden die Dateipfade für die Platzhaltervereinigung angezeigt, die Sie für Ihre Bestellungen aus dem Süden vorgenommen haben. Sie belassen dieses Feld an dieser Stelle, da es gute Informationen enthält.

      Tipp: Beim Korrigieren nicht übereinstimmender Felder nach einer Vereinigung haben Sie verschiedene Optionen.

      Je nach verwendeter Tableau Prep Builder-Version können Sie ein Feld in der Liste Nicht übereinstimmende Felder auswählen (Version 2018.2.1 und höher), und wenn Tableau Prep Builder eine mögliche Übereinstimmung erkennt, wird sie gelb hervorgehoben. Wenn Sie die Felder zusammenführen möchten, zeigen Sie mit der Maus auf das hervorgehobene Feld, und klicken Sie auf die angezeigte Plus-Schaltfläche .

      Weitere Möglichkeiten zum Zusammenführen von Feldern in einer Vereinigung finden Sie unter Korrigieren von nicht übereinstimmenden Feldern.

    7. Deaktivieren Sie das Kontrollkästchen Nur nicht übereinstimmende Felder anzeigen, um alle in der Vereinigung enthaltenen Felder anzuzeigen.

    8. Benennen Sie Ihren Vereinigungsschritt so, dass nachvollziehbar ist, was diese Vereinigung enthält. Beispiel: Alle Bestellungen.

    Kontrollieren Sie Ihre Arbeit: Sehen Sie das "Vereinigen von Daten" in Aktion.

    Klicken Sie zur erneuten Wiedergabe auf das Bild.

    Sie sind ein Bereinigungsgenie! Während Sie die Ergebnisse bewundern, ruft Ihr Chef an. Er vergaß zu erwähnen, dass Sie auch die Produktrücksendungen in Ihre Analyse einbeziehen sollen. Er hofft, dass dies keine großen Umstände bereitet. Mit Tableau Prep Builder in Ihrem Toolkit ist dies überhaupt kein Problem.

    Bereinigen der Produktrücksendungsdaten

    Sie sehen sich die Excel-Datei an, die Ihnen Ihr Chef für Produktrücksendungen gesendet hat. Sie sieht etwas chaotisch aus. Sie fügen die neue Datei return_reasons new Ihrem Schema hinzu, um sie sich genauer anzusehen.

    1. Klicken Sie im Bereich Verbindungen auf Verbindung hinzufügen. Wählen Sie Microsoft Excel aus und navigieren Sie zu den Superstore-Beispieldatendateien (Informationen zum Dateispeicherort finden Sie unter Beispieldateien).

    2. Wählen Sie return reasons_new.xlsx aus, und klicken Sie dann auf Öffnen, um die Datei dem Schemabereich hinzuzufügen.

      Aus dieser Datei möchten Sie lediglich 4 Felder in Ihr Schema einbeziehen: Bestell-ID, Produkt-ID, Rücksendungsgrund und Hinweis.

    3. Deaktivieren Sie im Bereich Eingabe für return_new das Kontrollkästchen am oberen Rand des Feldrasters, um alle Kontrollkästchen zu deaktivieren. Aktivieren Sie dann das Kontrollkästchen für die Felder Bestell-ID, Produkt-ID, Rücksendungsgrund und Hinweise.

    4. Benennen Sie den Eingabeschritt um, sodass er die in der Eingabe enthaltenen Daten besser widerspiegelt. Doppelklicken Sie im Bereich Schema auf den Namen des Eingabeschritts Returns_new, und geben Sie Rücksendungen (alle) ein.

      Während Sie die Beispiel-Feldwerte untersuchen, bemerken Sie, dass in dem Feld Hinweise offensichtlich viele verschiedene Daten miteinander kombiniert wurden.

      Sie müssen diese Datei bereinigen, bevor Sie die Daten weiter bearbeiten können. Sie fügen daher einen Bereinigungsschritt hinzu.

    5. Wählen Sie im Bereich Schema den Eingabeschritt Rücksendungen (alle) aus, klicken Sie auf das Pluszeichen und wählen Sie dann "Schritt hinzufügen" aus.

      Ändern Sie im Bereich Profil die Größe des Feldes Hinweise, damit die Einträge besser sichtbar sind. Klicken Sie auf den äußeren rechten Rand des Feldes und ziehen Sie ihn nach rechts.

    6. Verwenden Sie im Feld Hinweise die visuelle Bildlaufleiste rechts neben den Feldwerten, um die Werte zu prüfen.

      Sie stellen einige Probleme fest:

      • Einige Einträge haben ein zusätzliches Leerzeichen. Dies kann dazu führen, dass das Feld als Nullwert gelesen wird.

      • Scheinbar ist der Name des Genehmigers im Eintrag der Rücksendungshinweise enthalten. Um die Arbeit mit diesen Daten zu vereinfachen, möchten Sie diese Informationen in einem separaten Feld anordnen.

      Sie möchten sich um die zusätzlichen Leerzeichen kümmern und erinnern sich an eine Bereinigungsoption zum Entfernen von nachstehenden Leerzeichen. Sie probieren sie aus, um das Problem zu beheben.

    7. Wählen sie das Feld Hinweise aus. Klicken Sie auf das Menü Weitere Optionen (in vorherigen Versionen waren dies Drop-down-Pfeile) und wählen Sie Bereinigen > Leerzeichen kürzen aus.

      Ja! Sie haben exakt das erreicht, was Sie wollten. Die zusätzlichen Leerzeichen sind nicht mehr da.

      Als Nächstes möchten Sie ein separates Feld für den Namen des Genehmigers erstellen. Sie sehen die Option Werte aufteilen im Menü und möchten sie ausprobieren.

    8. Wählen sie das Feld Hinweise aus. Klicken Sie auf das Menü Weitere Optionen (in vorherigen Versionen waren dies Drop-down-Pfeile) und wählen Sie Werte aufteilen > Automatische Aufteilung aus.

      Diese Funktion hat Ihre Erwartungen vollständig erfüllt. Die Rücksendungshinweise und der Name des Genehmigers wurden automatisch in separate Felder aufgeteilt.

      Genau wie Tableau Desktop hat Tableau Prep Builder diesen Feldern automatisch einen Namen zugewiesen. Sie müssen die neuen Felder also sinnvoll umbenennen.

    9. Wählen Sie das Feld Hinweise-Aufteilung 1 aus. Doppelklicken Sie auf den Feldnamen, und geben Sie Rücksendungshinweise ein.

    10. Wiederholen Sie diesen Schritt für das zweite Feld, und benennen Sie es in Genehmiger um.

    11. Entfernen Sie schlussendlich das ursprüngliche Feld Hinweise, da Sie es nicht mehr benötigen. Wählen Sie das Feld Hinweise aus, klicken Sie auf das Menü Weitere Optionen (in vorherigen Versionen waren dies Dropdown-Pfeile) und wählen Sie im Menü den Eintrag Entfernen (Feld entfernen in vorherigen Versionen) aus.

      Sie untersuchen das neue Feld Genehmiger und stellen fest, dass unter den Feldwerten zwar dieselben Namen aufgelistet sind, diese jedoch unterschiedlich eingegeben wurden. Sie möchten sie gruppieren, um mehrere Varianten desselben Werts zu eliminieren.

      Vielleicht ist dabei die Option Gruppieren und Ersetzen hilfreich?

      Sie erinnern sich an die Option für Gemeinsame Zeichen. Da diese Werte dieselben Buchstaben enthalten, probieren Sie sie aus.

    12. Wählen sie das Feld Genehmiger aus. Klicken Sie auf das Menü Weitere Optionen (in vorherigen Versionen waren dies Dropdown-Pfeile) und wählen Sie Gruppieren und Ersetzen > Gemeinsame Zeichen aus.

      Diese Option hat alle Varianten der einzelnen Namen für Sie gruppiert. Genau das war Ihre Absicht.

      Nachdem Sie die anderen Namen überprüft haben, um sicherzustellen, dass sie ordnungsgemäß gruppiert sind, klicken Sie auf Fertig, um den Editor zum Gruppieren und Ersetzen zu schließen.

      Diese Datei sieht recht ordentlich aus.

    13. Benennen Sie den Bereinigungsschritt, um Ihre Arbeit nachverfolgen zu können. Beispiel: Hinweise bereinigt.

    Da nun alle Produktrücksendungsdaten bereinigt wurden, möchten Sie diese Daten den Bestellungsdaten aus den vereinigten Dateien hinzufügen. Viele dieser Felder sind jedoch in den vereinigten Dateien nicht vorhanden. Zum Hinzufügen dieser Felder (Spalten mit Daten) zu dem vereinigten Datensatz müssen Sie eine Verknüpfung verwenden.

    Verknüpfen von Daten

    Beim Verknüpfen von Daten müssen die Dateien mindestens ein gemeinsames Feld aufweisen. Ihre Dateien enthalten jeweils die Felder Bestell-ID und Produkt-ID, sodass Sie eine Verknüpfung für diese Felder durchführen können, um alle Zeilen anzuzeigen, die diese Felder gemeinsam haben. Sie erinnern sich an eine Option zum Erstellen einer Verknüpfung, als Sie Ihre Vereinigung per Drag-and-Drop erstellt haben, und Sie möchten sie ausprobieren.

    1. Ziehen Sie im Bereich Schema den Schritt Hinweise bereinigt zum Vereinigungsschritt Alle Bestellungen, und legen Sie den Schritt unter Verknüpfung ab.

      Beim Verknüpfen von Dateien zeigt Tableau Prep Builder die Ergebnisse der Verknüpfung im Verknüpfungsprofil an.

      Das Arbeiten mit Verknüpfungen kann sich kompliziert gestalten. Oftmals wünscht man sich eine klare Übersicht über die in die Verknüpfung einbezogenen Faktoren, beispielsweise die zum Verknüpfen der Dateien verwendeten Felder, die Anzahl der in den Ergebnissen enthaltenen Zeilen und Felder, die nicht einbezogen wurden oder Nullwerte sind.

      Während Sie die Ergebnisse der Verknüpfung in Tableau Prep Builder prüfen, sind Sie begeistert von der Fülle der Informationen und von der Interaktivität.

      Tipp: Im äußersten linken Bereich des Verknüpfungsprofils können Sie die Verknüpfung untersuchen und damit interagieren. Sie können Werte auch direkt in den Bereichen für die Join-Klauseln korrigieren und im Bereich "Verknüpfungsergebnisse" Bereinigungsvorgänge ausführen.

      Klicken Sie in das Diagramm Verknüpfungstyp, um verschiedene Verknüpfungskonfigurationen zu testen und die Anzahl der in der Verknüpfung enthaltenen oder daraus ausgeschlossenen Zeilen für die einzelnen Tabellen im Bereich Zusammenfassung der Verknüpfungsergebnisse anzuzeigen.

      Wählen Sie im Bereich "Angewandte Join-Klauseln" die Felder aus, die Sie verknüpfen möchten, oder fügen Sie vorgeschlagene Join-Klauseln aus dem Bereich "Join-Klausel-Empfehlungen" hinzu.

      Weitere Informationen zum Arbeiten mit Verknüpfungen finden Sie unter Aggregieren, Verknüpfen oder Vereinigen von Daten.

      Sie stellen fest, dass Sie mehr als 13.000 Zeilen aus den Dateien Alle Bestellungen ausgeschlossen haben. Beim Erstellen der Verknüpfung hat Tableau Prep Builder automatisch eine Verknüpfung für das Feld Produkt-ID durchgeführt. Sie möchten jedoch auch eine Verknüpfung für das Feld Bestell-ID vornehmen.

      Beim Überprüfen des linken Bereichs des Verknüpfungsprofils stellen Sie fest, dass die Bestell-ID in der Liste der empfohlenen Join-Klauseln enthalten ist, und Sie fügen sie kurzerhand von dort aus hinzu.

    2. Wählen Sie im linken Bereich des Profils Verknüpfung im Bereich Join-Klausel-Empfehlungen den Eintrag Bestell-ID = Bestell-ID aus, und klicken Sie auf die Plus-Schaltfläche , um die Join-Klausel hinzuzufügen.

      Da der Verknüpfungstyp auf eine innere Verknüpfung festgelegt ist (Standardeinstellung für Tableau Prep Builder), werden nur Werte in die Verknüpfung einbezogen, die in beiden Dateien vorhanden sind. Sie möchten jedoch alle Daten aus den Dateien für die Bestellungen sowie die Rücksendungsdaten für diese Dateien einbeziehen. Demzufolge müssen Sie den Verknüpfungstyp ändern.

    3. Klicken Sie im Abschnitt Verknüpfungstyp auf die Seite des Diagramms, um alle Bestellungen anzuzeigen. Klicken Sie im folgenden Beispiel auf die linke Seite des Diagramms, um den Verknüpfungstyp in eine Links-Verknüpfung zu ändern und alle Daten aus dem Vereinigungsschritt Alle Bestellungen und alle übereinstimmenden Daten aus dem Schritt Bereinigte Hinweise einzuschließen.

      Nun haben Sie alle Daten aus den Bestellungsdateien und die Rücksendungsdaten einbezogen, die für diese Bestellungen zutreffen. Sie überprüfen den Bereich Join-Klauseln und sehen die eindeutigen Werte, die in der anderen Datei nicht vorhanden sind.

      Es existieren beispielsweise viele Bestellungszeilen (rot dargestellt), für die keine entsprechenden Rücksendungsdaten vorhanden sind. Sie sind begeistert von der Möglichkeit, diese Detailstufe Ihrer Verknüpfung untersuchen zu können.

      Sie sind darauf gespannt, die Analyse dieser Daten in Tableau Desktop zu starten, möchten jedoch vorher einige Ergebnisse der Verknüpfung bereinigen. Gut, dass Sie wissen, was zu tun ist!

      Tipp: Sie fragen sich, ob Sie die Daten ausreichend bereinigt haben? Sie können in Tableau Desktop in einem beliebigen Schritt des Schemas eine Vorschau Ihrer Daten anzeigen, um dies zu prüfen.

      Klicken Sie einfach mit der rechten Maustaste in den Bereich Schema, und wählen Sie im Menü den Eintrag Vorschau in Tableau Desktop aus.

      Sie können sorglos mit Ihren Daten experimentieren, ohne dass die in Tableau Desktop vorgenommenen Änderungen in Ihre Datenquelle in Tableau Prep Builder zurückgeschrieben werden. Weitere Informationen finden Sie unter Anzeigen einer Stichprobe in Tableau.

    4. Bevor Sie mit der Bereinigung Ihrer Verknüpfungsergebnisse beginnen, benennen Sie den Schritt Verknüpfung mit Bestellungen+Rücksendungen, und speichern Sie das Schema.

    Bereinigen der Verknüpfungsergebnisse

    Hinweis: Wenn Sie die Felder in Ihrer Verknüpfung bereinigen möchten, können Sie direkt im Verknüpfungsschritt Bereinigungsvorgänge ausführen. Für die Zwecke dieses Tutorials fügen wir einen Bereinigungsschritt hinzu, sodass Sie Ihre Bereinigungsvorgänge eindeutig erkennen können. Wenn Sie diese Schritte direkt im Verknüpfungsschritt ausführen möchten, überspringen Sie die Schritte 1 und 3 unten.

    Als Sie die beiden Schritte verknüpft haben, wurden die gemeinsamen Felder "Bestell-ID" und "Produkt-ID" für beide Tabellen hinzugefügt.

    Sie möchten das Feld "Produkt-ID" aus allen Bestellungen und das Feld "Bestell-ID" aus der Datei der Rücksendungen beibehalten und doppelte Felder, die in diesen Feldern enthalten waren, entfernen. Ferner benötigen Sie die Felder Dateipfade und Tabellennamen nicht in Ihrer Ausgabedatei. Daher möchten Sie auch diese Felder entfernen.

    Tipp: Beim Verknüpfen von Tabellen mit Feldern, die in beiden Dateien vorhanden sind, fügt Tableau Prep Builder beide Felder hinzu und benennt das doppelte Feld aus der zweiten Datei um, indem dem Feldnamen eine "-1" oder "-2" hinzugefügt wird. Beispiel: Bestell-ID und Bestell-ID-1.

    1. Wählen Sie im Bereich Schema den Eintrag Bestellungen+Rücksendungen aus, klicken Sie auf das Pluszeichen und wählen Sie dann "Schritt hinzufügen" aus.

    2. Wählen Sie im Bereich Profil die folgenden Felder aus, und entfernen Sie sie:

      • Tabellennamen

      • Bestell-ID

      • Dateipfade

      • Produkt-ID-1

    3. Benennen Sie das Feld Bestell-ID-1 in Bestell-ID um.

      Es liegen einige Nullwerte vor, bei denen das Produkt zurückgesendet, aber kein Rücksendungshinweis oder Genehmiger angegeben wurde. Damit diese Daten leichter analysiert werden können, möchten Sie ein Feld mit dem Wert Ja und Nein für die Angabe hinzufügen, ob das Produkt zurückgesendet wurde.

      Dieses Feld ist nicht vorhanden. Sie können es hinzufügen, indem Sie ein berechnetes Feld erstellen.

    4. Klicken Sie in der Symbolleiste auf Berechnetes Feld erstellen.

    5. Benennen Sie das Feld mit Zurückgesendet?, geben Sie dann die folgende Berechnung ein, und klicken Sie auf Speichern.

      If ISNULL([Return Reason])=FALSE THEN "Yes" ELSE "No" END

      Für Ihre Analyse möchten Sie auch wissen, wie viele Tage es dauert, eine Bestellung zu liefern. Dieses Feld ist jedoch ebenfalls nicht vorhanden.

      Sie haben jedoch alle Informationen, die Sie benötigen, um es zu erstellen. Daher fügen Sie ein weiteres berechnetes Feld hinzu, um das Feld zu erstellen.

    6. Klicken Sie in der Symbolleiste auf Berechnetes Feld erstellen.

    7. Benennen Sie das Feld mit Tage für Lieferung, geben Sie dann die folgende Berechnung ein, und klicken Sie auf Speichern.

      DATEDIFF('day',[Order Date],[Ship Date])

    8. Benennen Sie den Schritt mit Bestellungen+Rücksendungen bereinigen.

    9. Speichern Sie Ihr Schema.

    5. Ausführen des Schemas und Generieren der Ausgabe

    Ihre Daten sehen gut aus, und Sie sind bereit, die Ausgabedatei zu generieren, um mit der Analyse in Tableau Desktop zu beginnen. Dazu müssen Sie nur Ihr Schema ausführen und Ihre Extraktdatei generieren. Dazu müssen Sie einen Schritt vom Typ Ausgabe hinzufügen.

    1. Wählen Sie im Schemabereich den Eintrag Bestellungen+Rücksendungen bereinigen aus, klicken Sie auf das Pluszeichen und wählen Sie dann Ausgabe hinzufügen aus.

      Beim Hinzufügen eines Ausgabeschritts wird der Bereich Ausgabe mit einem Snapshot Ihrer Daten geöffnet. Hier können Sie den zu generierenden Ausgabetyp auswählen und den Namen sowie den Speicherort der Datei angeben.

      Das Standardverzeichnis befindet sich im Repository Mein Tableau Prep Builder im Ordner Ihrer Datenquellen.

    2. Wählen Sie im linken Bereich in der Ausgabe speichern in die Dropdown-Liste Datei aus (wählen Sie Datei speichern in früheren Versionen).

    3. Klicken Sie auf die Schaltfläche Durchsuchen. Geben Sie dann im Dialogfeld Extrakt speichern unter einen Namen für die Datei ein, z. B. Bestellungen_Rücksendungen_Superstore, und klicken Sie auf Übernehmen.

    4. Wählen Sie im Feld Ausgabetyp den Ausgabetyp aus. Je nach der von Ihnen verwendeten Tableau Desktop-Version können Sie zwischen den folgenden Optionen wählen:

      • Tableau-Datenextrakt (.hyper) für Tableau Desktop-Version 10.5 und höher.

      • Tableau-Datenextrakt (.tde) für Tableau Desktop-Version 10.0 bis 10.4.

      • Durch Komma getrennte Werte (.csv), wenn Sie den Extrakt für Dritte freigeben möchten.

      Tipp: Beim Generieren der Ausgabe in Ihrem Schema haben Sie mehrere Möglichkeiten. Sie können eine Extraktdatei generieren oder Ihre Daten als Datenquelle in Tableau Server oder Tableau Online veröffentlichen. Weitere Informationen zum Generieren von Ausgabedateien finden Sie unter Erstellen und Veröffentlichen von Datenextrakten und Datenquellen.

    5. Zeigen Sie im Abschnitt Schreiboptionen die Optionen zum Schreiben der neuen Daten in Ihre Dateien an. Sie möchten die Standardeinstellung (Tabelle erstellen) verwenden und die Tabelle durch die Flow-Ausgabe ersetzen, sodass sich hier nichts ändern kann.

      Tipp: Ab Version 2020.2.1 können Sie auswählen, wie Sie Ihre Flussdaten zurück in die Tabelle schreiben möchten. Sie können zwischen zwei Optionen wählen: Tabelle erstellen oder Tabelle anfügen. Standardmäßig verwendet Tableau Prep Builder die Option Tabelle erstellen und überschreibt Ihre Tabellendaten mit den neuen Daten, wenn Sie den Flow ausführen. Wenn Sie Tabelle anhängen auswählen, fügt Tableau Prep Builder die Flussdaten zur vorhandenen Tabelle hinzu, damit Sie sowohl neue als auch historische Daten bei jedem Flow-Lauf nachverfolgen können. Weitere Informationen finden Sie unter Konfigurieren von Schreiboptionen.

    6. Klicken Sie im Ausgabefenster auf Schemen ausführen oder auf die Schaltfläche Schemen ausführen im Bereich "Schema", um Ihre Ausgabe zu generieren.
    7. Wenn die Ausführung des Schemas abgeschlossen ist, wird in einem Status-Dialogfeld zusätzlich zu der Ausführungsdauer angegeben, ob die Schemaausführung erfolgreich war. Klicken Sie auf Fertig, um das Dialogfeld zu schließen.

      Um die Daten aktualisiert zu halten, können Sie das Schema manuell hier in Tableau Prep Builder oder mittels der Befehlszeile ausführen. Wenn Sie das Data Management Add-on aktiviert und Tableau Prep Conductor aktiviert haben, können Sie den Flow auch in einem Zeitplan veröffentlichen Tableau ServerTableau Online oder ausführen.

      Ab Version 2020.2.1 können Sie auch alle Daten jedes Mal aktualisieren, wenn der Flow ausgeführt wird, oder den Flow mit inkrementeller Aktualisierung ausführen und jedes Mal nur die neuen Daten verarbeiten.

      Weitere Informationen zum Verwalten Ihrer Lizenz finden Sie unter den folgenden Themen:

    Nachbereitung und Ressourcen

    Sie sind ein Superstar der Datenvorbereitung! Sie hatten unreine Daten und haben Sie mit Leichtigkeit umgewandelt! Innerhalb kürzester Zeit haben Sie Ihre Daten aus mehreren Datensätzen bereinigt, aufbereitet und sie in einen schlanken, reinen Datensatz konvertiert, sodass Sie nun damit in Tableau Desktop arbeiten können, um Ihre Analyse durchzuführen.

    Sie möchten weiter üben? Wiederholen Sie den Rest des Beispielschemas für Superstore mithilfe der nachfolgend angegebenen Datendateien:

    Nach der Installation von Tableau Prep Builder befinden sich diese Dateien bereits im folgenden Verzeichnis auf Ihrem Computer:

    • (Windows) C:\Program Files\Tableau\Tableau Prep Builder <version>\help\Samples\en_US\Superstore Files
    • (Mac) /Applications/Tableau Prep Builder <version>.app/Contents/help/Samples/en_US/Superstore Files

    Sie möchten eine weitere Schulung belegen? Sehen Sie sich die Schulungsvideos für Tableau Prep Builder an, sehen Sie sich diese großartigen Ressourcen an, oder nehmen Sie an einem persönlichen Schulungskurs teil.

    Sie möchten weitere Informationen zu den behandelten Themen erhalten? Schlagen Sie in der Tableau Prep Builder-Onlinehilfe nach und informieren Sie sich dort auch zu weiteren Themen.

    Andere Artikel in diesem Abschnitt

    Vielen Dank für Ihr Feedback! Es gab einen Fehler bei der Übermittlung Ihres Feedback. Versuchen Sie es erneut oder senden Sie uns eine Nachricht.