Hinweis: Ab Version 2020.4.1 können Sie Schemata jetzt in Tableau Server und Tableau Cloud erstellen und bearbeiten. Der Inhalt in diesem Thema gilt für alle Plattformen, sofern nicht ausdrücklich anders angegeben. Weitere Informationen zum Erstellen von Schemata im Internet finden Sie unter Tableau Prep im Internet in der Tableau Server(Link wird in neuem Fenster geöffnet)- und Tableau Cloud(Link wird in neuem Fenster geöffnet)-Hilfe.

Wenn Sie bestimmen möchten, welcher Anteil Ihres Datensatzes in das Schema einbezogen werden soll, können Sie Ihren Datensatz konfigurieren. Beim Herstellen einer Verbindung mit Ihren Daten oder beim Ziehen von Tabellen in den Bereich Schema wird dem Schema automatisch ein Eingabeschritt hinzugefügt.

Im Eingabeschritt können Sie entscheiden, welche und wie viele Daten in Ihrem Schema enthalten sein sollen. Dies ist immer der erste Schritt im Schema.

Wenn Sie mit einer Excel- oder Textdatei verbunden sind, können Sie auch die Daten aus dem Eingabeschritt aktualisieren. Weitere Informationen dazu finden Sie unter Hinzufügen weiterer Daten im Eingabeschritt(Link wird in neuem Fenster geöffnet).

Im Eingabeschritt ist Folgendes möglich:

  • Klicken Sie mit der rechten Maustaste bzw. Befehlstaste-Klick (MacOS) auf den Eingabeschritt im Schemabereich, um ihn umzubenennen oder zu entfernen.
  • Vereinigen Sie mehrere Dateien im gleichen über- oder untergeordneten Verzeichnis. Weitere Informationen dazu finden Sie unter Vereinigen von Dateien und Datenbanktabellen im Schritt "Eingabe".
  • (Version 2023.1 und höher) Schließen Sie automatisch generierte Zeilennummern basierend auf der ursprünglichen Sortierreihenfolge Ihres Datensatzes ein. Siehe Einschließen der Zeilennummern aus Ihrem Datensatz.
  • Suchen Sie nach Feldern.
  • Siehe Beispiele für Feldwerte.
  • Konfigurieren Sie die Feldeigenschaften, indem Sie den Feldnamen ändern oder die Texteinstellungen für Textdateien konfigurieren.

    Hinweis: Feldwerte mit eckigen Klammern werden automatisch in normale Klammerzeichen konvertiert.

  • Führen Sie Aktionen durch, um die Menge der Daten zu ändern, die Sie in Ihrem Schema sehen. Siehe Festlegen der Stichprobengröße.
    • Konfigurieren Sie die Datenprobe, mit der Sie in Ihrem Schema arbeiten möchten.
    • Entfernen Sie Felder, die Sie nicht benötigen. Sie können jederzeit zum Eingabeschritt zurückkehren und sie später einfügen.
    • Blenden Sie Felder aus, die Sie nicht bereinigen müssen, aber dennoch in Ihr Schema aufnehmen möchten. Sie können sie bei Bedarf jederzeit wieder einblenden.
    • Wenden Sie Filter auf ausgewählte Felder an.
  • Ändern Sie den Felddatentyp für Datenverbindungen, die dies unterstützen.

    Dazu gehören Microsoft Excel-, Text- und PDF-Dateien sowie Daten aus Box, Dropbox, Google Drive und OneDrive. Für andere Datenquellen können Sie den Datentyp in einem Bereinigungsschritt ändern.

    Weitere Informationen finden Sie unter Überprüfen der Ihren Daten zugeordneten Datentypen.

Einschließen der Zeilennummern aus Ihrem Datensatz

Unterstützt in Tableau Prep Builder Version 2023.1 und höher und im Web für Microsoft Excel- und Textdateien (.csv).

Hinweis: Diese Option wird derzeit nicht für Dateien unterstützt, die in einer Eingabevereinigung enthalten sind.

Ab Version 2023.1 generiert Tableau Prep automatisch ein Zeilennummernfeld für Sie für die Dateitypen Microsoft Excel oder Text (.csv). Wenn Sie in früheren Versionen Zeilennummern basierend auf der ursprünglichen Sortierreihenfolge Ihrer Daten einschließen wollten, mussten Sie diese manuell zur Quelle hinzufügen, bevor Sie den Datensatz zu Ihrem Schema hinzufügen.

Dieses Feld wird im Eingabeschritt generiert, wenn Sie eine Verbindung zu Ihren Daten herstellen. Standardmäßig ist es aus dem Schema ausgeschlossen, aber Sie können es mit einem Klick einschließen. Sobald es Ihrem Schema hinzugefügt wurde, verhält es sich wie jedes andere Feld und kann in Ihren Schemavorgängen und berechneten Feldern verwendet werden.

Tableau Prep unterstützt auch die ROW_NUMBER-Funktion für berechnete Felder. Diese Funktion ist nützlich, wenn Ihr Datensatz Felder enthält, die eine Sortierung definieren können, wie z. B. Zeilen-ID oder Zeitstempel. Weitere Informationen zur Verwendung dieser Funktion finden Sie unter Erstellen von Detailgenauigkeits-, Rang- und Kachelberechnungen.

Hinzufügen des Zeilennummernfeldes der Quelle zu Ihrem Schema

  1. Klicken Sie mit der rechten Maustaste oder bei gedrückter Befehlstaste (MacOS) auf das Feld oder klicken Sie auf das Menü Mehr Optionen und wählen Sie Feld einschließen.

  2. Die Änderungsliste wird gelöscht, das Feld ist jetzt Teil der Schemadaten und Sie können die generierten Zeilennummern in nachfolgenden Schemaschritten sehen.

Details zur Quellzeilennummer

Wenn Sie die Quellzeilennummer in Ihren Datensatz einbeziehen, gelten die folgenden Optionen und Überlegungen.

  • Die Zeilennummern der Datenquelle werden vor Datenstichproben oder Filtern angewendet.
  • Quellzeilennummern sind für jede Tabelle spezifisch. Jede Eingabe in der Vereinigung behält die ursprüngliche Sortierreihenfolge bei.
  • Dadurch wird ein neues Feld mit dem Namen Quellzeilennummer erstellt, das während des gesamten Schemas bestehen bleibt. Dieser Feldname ist nicht lokalisiert, kann aber jederzeit umbenannt werden.
  • Existiert bereits ein Feld mit diesem Namen, wird der neue Feldname um 1 erhöht. Zum Beispiel Quellzeilennummer-1, Quellzeilennummer-2 usw.
  • Sie können den Datentyp des Felds in den nachfolgenden Schritten ändern.
  • Sie können dieses Feld in Schemaoperationen und Berechnungen verwenden.
  • Dieser Wert wird jedes Mal für den gesamten Datensatz neu generiert, wenn die Eingabedaten aktualisiert werden oder das Schema ausgeführt wird.
  • Dieses Feld ist für Eingabevereinigungen nicht verfügbar.

Herstellen einer Verbindung zu einer benutzerdefinierten SQL-Abfrage

Wenn Ihre Datenbank die Verwendung von benutzerdefinierter SQL unterstützt, wird Benutzerdefinierte SQL in der Nähe des unteren Randes des Bereichs Verbindungen angezeigt. Doppelklicken Sie auf Benutzerdefinierte SQL, um die Registerkarte Benutzerdefinierte SQL zu öffnen. Dort können Sie Abfragen für vorab ausgewählte Daten eingeben und quellenspezifische Vorgänge anwenden. Nachdem die Abfrage den Datensatz abgerufen hat, können Sie die einzubeziehenden Felder auswählen, Filter anwenden oder den Datentyp ändern, bevor Sie Ihrem Schema Daten hinzufügen.

Weitere Informationen zur Verwendung von benutzerdefiniertem SQL finden Sie unter Verbindung zu Daten mithilfe von benutzerdefinierter SQL.

Anwenden von Bereinigungsvorgängen in einem Eingabeschritt

In einem Eingabeschritt sind nur einige Bereinigungsvorgänge verfügbar. In der Eingabe-Feldliste können Sie die folgenden Änderungen vornehmen. Ihre Änderungen werden im Bereich Anpassungen nachverfolgt, und im Bereich Schema sowie in der Eingabe-Feldliste werden links neben dem Eingabeschritt Anmerkungen hinzugefügt.

  • Feld ausblenden: Blenden Sie Felder aus, anstatt sie zu entfernen, um Unordnung in Ihrem Schema zu vermeiden. Sie können diese bei Bedarf jederzeit einblenden. Ausgeblendete Felder werden weiterhin eingeschlossen, wenn Sie Ihr Schema ausführen.
  • Filter: Verwenden Sie den Berechnungseditor, um Werte zu filtern. Ab Version 2023.1 können Sie jetzt auch das Dialogfeld Relativer Datumsfilter verwenden, um schnell Datumsbereiche für beliebige Datums- oder Datums- und Zeitfelder anzugeben.
  • Feld umbenennen: Doppelklicken bzw. Strg-Klick (bei MacOS) Sie im Feld Feldname auf den Feldnamen und geben Sie einen neuen Feldnamen ein.

  • Datentyp ändern: Klicken Sie auf den Datentyp für das Feld und wählen Sie im Menü einen neuen Datentyp aus. Diese Option wird derzeit für Microsoft Excel-, Text- und PDF-Dateien, Box-, Dropbox-, Google Drive- und OneDrive-Datenquellen unterstützt. Alle anderen Datenquellen können in einem Bereinigungsschritt geändert werden.

Auswählen der in das Schema einzubeziehenden Felder

Hinweis: Ab Version 2023.1 können Sie mehrere Felder auswählen, um sie auszublenden, einzublenden, zu entfernen oder einzuschließen. In früheren Versionen konnten Sie mit jeweils einem Feld arbeiten und die Kontrollkästchen zum Einschließen oder Entfernen von Feldern aktivieren oder deaktivieren.

Im Bereich Eingabe wird eine Liste mit Feldern in Ihrem Datensatz angezeigt. Standardmäßig sind alle Felder mit Ausnahme des automatisch generierten Felds Quellzeilennummer enthalten. Verwenden Sie die folgenden Optionen, um Ihre Felder zu verwalten.

  • Suchen: Suchen nach Feldern in der Liste.
  • Ausblenden: Klicken Sie auf das Augensymbol oder wählen Sie Felder ausblenden im Menü Mehr Optionen zum Ausblenden von Feldern, die Sie in Ihr Schema einbeziehen möchten, aber nicht bereinigen müssen. Felder werden vom Schema während der Laufzeit verarbeitet. Weitere Informationen finden Sie unter Ausblenden von Feldern(Link wird in neuem Fenster geöffnet).
  • Felder einschließen: Wählen Sie eine oder mehrere Zeilen aus und klicken Sie mit der rechten Maustaste bzw. bei gedrückter Befehlstaste (MacOS), oder klicken Sie auf das Menü Mehr Optionen und wählen Sie Felder einschließen aus, um als entfernt markierte Felder wieder hinzuzufügen.
  • Felder entfernen: Wählen Sie eine oder mehrere Zeilen aus und klicken Sie mit der rechten Maustaste bzw. bei gedrückter Befehlstaste (MacOS) und dann auf das „X“, oder klicken Sie auf das Menü Mehr Optionen und wählen Sie Felder entfernen aus, um Felder zu entfernen, die Sie nicht in das Schema aufnehmen möchten.

Anwenden von Filtern auf Felder im Eingabeschritt

Im Eingabeschritt können Sie mit dem Berechnungseditor einen Filter anwenden. Ab Version 2023.1 können Sie Datumsfeldern auch einen relativen Datumsfilter hinzufügen, um Daten für einen bestimmten Datumsbereich in Ihr Schema einzubeziehen. Weitere Informationen finden Sie unter „Filter für relatives Datum“ in Filtern von Daten(Link wird in neuem Fenster geöffnet).

Weitere Filtermöglichkeiten stehen in anderen Schritttypen zur Verfügung. Weitere Informationen finden Sie unter Filtern von Daten(Link wird in neuem Fenster geöffnet).

Anwenden eines Berechnungsfilters

  1. Klicken Sie in der Symbolleiste auf Werte filtern.

  2. Geben Sie im Berechnungs-Editor Ihre Filterkriterien ein.

Anwenden einez relativen Datumsfilters

  1. Wählen Sie im Eingaberaster ein Feld mit dem Datentyp „Datum“ oder „Datum und Uhrzeit“ aus. Klicken Sie dann mit der rechten Maustaste bzw. bei gedrückter Befehlstaste (MacOS) oder klicken Sie auf das Menü Mehr Optionen und wählen Sie Filter > Relative Daten aus.

  2. Verwenden Sie den Filter Relative Daten, um den genauen Bereich in Jahren, Quartalen, Monaten, Wochen oder Tagen anzugeben, den Sie in Ihren Daten sehen möchten. Sie können auch einen Anker für ein bestimmtes Datum konfigurieren und alle Nullwerte einbeziehen.

Ändern von Feldnamen

Wenn Sie den Namen eines Feldes ändern möchten, wählen Sie in der Spalte Feldname den Namen aus, und geben Sie dann den neuen Namen in das Feld ein. Im Feldraster und im Bereich Schema links neben dem Eingabeschritt wird eine Anmerkung hinzugefügt. Ihre Änderungen werden auch im Anpassungsbereich verfolgt.

Ändern von Datentypen

Wird derzeit für Microsoft Excel-, Text- und PDF-Dateien, Box-, Dropbox-, Google Drive- und OneDrive-Datenquellen unterstützt. Alle anderen Datenquellen können in einem Bereinigungsschritt geändert werden.

Hinweis: Der Datentyp für die Quellzeilennummer (Version 2023.1 und höher) kann nur in einem Clean-Schritt oder einem anderen Schritttyp geändert werden.

Wenn Sie den Datentyp für ein Feld ändern möchten, gehen Sie wie folgt vor:

  1. Klicken Sie auf den Datentyp für das Feld.

  2. Wählen Sie im Menü den neuen Datentyp aus.

    Sie können auch den Datentyp für Felder in anderen Schritttypen im Schema ändern, oder Datenrollen zuordnen, um Ihre Feldwerte zu validieren. Weitere Informationen zum Ändern des Datentyps oder zur Verwendung von Datenrollen finden Sie unter Überprüfen der Ihren Daten zugeordneten Datentypen(Link wird in neuem Fenster geöffnet) und Datenrollen zur Datenvalidierung verwenden(Link wird in neuem Fenster geöffnet).

Konfigurieren von Feldeigenschaften

Wenn Sie mit Textdateien arbeiten, wird die Registerkarte Einstellungen angezeigt. Dort können Sie Ihre Verbindung bearbeiten und Texteigenschaften konfigurieren, beispielsweise das Feldtrennzeichen für Textdateien. Sie können die Dateiverbindung auch im Bereich "Verbindungen" bearbeiten oder Einstellungen für die inkrementelle Aktualisierung konfigurieren. Weitere Informationen zum Einrichten der inkrementellen Aktualisierung für Ihr Schema finden Sie unter Aktualisieren von Schemadaten mithilfe der inkrementellen Aktualisierung.

Wenn Sie mit Text- oder Excel-Dateien arbeiten, können Sie noch vor dem Starten des Schemas Datentypen korrigieren, die falsch abgeleitet wurden. Nach dem Starten des Schemas können Datentypen grundsätzlich in den Folgeschritten im Bereich Profil geändert werden.

Konfigurieren von Texteinstellungen in Textdateien

Wenn Sie die Einstellungen zum Analysieren von Textdateien ändern möchten, wählen Sie eine der folgenden Optionen aus:

  • Erste Zeile enthält Kopfzeile (Standard): Wählen Sie diese Option aus, um die erste Zeile als Feldbeschriftung zu verwenden.

  • Feldnamen automatisch generieren: Wählen Sie diese Option aus, wenn Tableau Prep Builder die Kopfzeilen für Felder automatisch generieren soll. Die Namenskonvention für Felder folgt demselben Modell wie Tableau Desktop. Beispiel: F1, F2 usw.

  • Feldtrennzeichen: Wählen Sie in der Liste ein Zeichen aus, das zum Trennen der Spalten verwendet werden soll. Wählen Sie Andere aus, um ein benutzerdefiniertes Zeichen einzugeben.

  • Textqualifizierer: Wählen Sie das Zeichen aus, das die Werte in die Datei einschließt.

  • Zeichensatz: Wählen Sie den Zeichensatz aus, der die Textdateicodierung beschreibt.

  • Gebietsschema: Wählen Sie das Gebietsschema aus, das zum Analysieren der Datei verwendet werden soll. Diese Einstellung gibt an, welche Dezimal- und Tausendertrennzeichen verwendet werden.

Festlegen der Stichprobengröße

Um die maximale Leistung beizubehalten, beschränkt Tableau Prep in das Schema einbezogenen Daten standardmäßig auf eine repräsentative Stichprobe Ihrer Daten. Die Stichprobe wird per Berechnung der optimalen Anzahl an Zeilen basierend auf der Gesamtzahl Felder im Datensatz und den Datentypen für diese Felder bestimmt. Anschließend ruft Tableau Prep schnellstmöglich die optimale Anzahl an Zeilen für die berechnete Menge ab.

Je nachdem, wie die Stichprobe berechnet und zurückgegeben wurde, kann die resultierende Stichprobe alle benötigten Zeilen enthalten oder nicht. Wenn die erwarteten Daten nicht angezeigt werden, können Sie die Stichprobeneinstellungen ändern, um die Abfrage erneut auszuführen.

Beim Erstellen oder Bearbeiten von Schemata im Web werden Grenzwerte auf die Datenmenge angewendet, die Sie in ein Schema einbeziehen können, und die verfügbaren Optionen zum Ändern des Datenbeispiels unterscheiden sich geringfügig von denen bei der Arbeit in Tableau Prep Builder. Weitere Informationen finden Sie unter Beispieldaten und Verarbeitungsgrenzen in der Tableau Server(Link wird in neuem Fenster geöffnet)- oder Tableau Cloud(Link wird in neuem Fenster geöffnet)-Hilfe.

Hinweis: Wenn Stichproben Ihrer Daten gezogen werden, wird das Badge Stichproben () im Bereich Profil angezeigt. Dieser bleibt für alle von Ihnen hinzugefügten Schritte bestehen. Von Ihnen vorgenommene Änderungen werden auf die Stichprobe angewendet, mit der Sie im Schema arbeiten. Sämtliche Änderungen werden beim Ausführen des Schemas auf den gesamten Datensatz angewendet.

Wenn Sie die Stichprobeneinstellungen ändern möchten, wählen Sie einen Eingabeschritt aus, und wählen Sie dann auf der Registerkarte Stichprobe eine der folgenden Optionen aus:

  • Standard-Stichprobenmenge (Standard): Tableau Prep berechnet die Gesamtzahl zurückzugebender Zeilen.

  • Alle Daten verwenden (nur Tableau Prep Builder): Rufen Sie unabhängig von der Größe alle Zeilen in Ihrem Datensatz ab. Dies kann dazu führen, dass die Leistung beeinträchtigt wird oder dass für Tableau Prep Builder eine Zeitüberschreitung auftritt.

    Hinweis: Um die Leistung aufrechtzuerhalten, wird auch bei Auswahl dieser Einstellung eine Datenabtastgrenze von 1 Million Zeilen auf die Schritttypen Aggregieren und Verknüpfen, und eine Datenabtastgrenze von 3 Millionen Zeilen auf die Schritttypen Vereinigen und Pivotieren angewendet.

  • Feste Zeilenanzahl: Wählen Sie die Anzahl der aus dem Datensatz zurückzugebenden Zeilen aus. Die empfohlene Zeilenanzahl beträgt 1 Million Zeilen oder weniger. Wenn Sie die Zeilenanzahl auf mehr als 1 Million festlegen, kann dadurch die Leistung beeinträchtigt werden.

    • In der Webdokumenterstellung: Die maximale Anzahl von Zeilen, die ein Benutzer bei Verwendung großer Datensätze auswählen kann, wird vom Administrator konfiguriert. Als Benutzer können Sie die Anzahl der Zeilen bis zu diesem Grenzwert auswählen.
  • Schnellauswahl (Standard): Die Datenbank gibt die angeforderte Zeilenanzahl schnellstmöglich zurück. Dies können die ersten N Zeilen oder die Zeilen sein, die die Datenbank aus einer vorherigen Abfrage im Speicher zwischengespeichert hat.

  • Zufällige Stichprobe: Die Datenbank gibt die angeforderte Anzahl Zeilen zurück, sie untersucht jedoch alle Zeilen im Datensatz und gibt eine repräsentative Stichprobe aller Zeilen zurück. Beim ersten Abrufen der Daten kann diese Option die Leistung beeinträchtigen.

Vielen Dank für Ihr Feedback!