Konfigurieren des Datensatzes

Hinweis: Ab Version 2020.4.1 können Sie Schemata jetzt in Tableau Server und Tableau Online erstellen und bearbeiten. Der Inhalt in diesem Thema gilt für alle Plattformen, sofern nicht ausdrücklich anders angegeben. Weitere Informationen zum Erstellen von Schemata im Web finden Sie unter Tableau Prep im Web.

Wenn Sie bestimmen möchten, welcher Anteil Ihres Datensatzes in das Schema einbezogen werden soll, können Sie Ihren Datensatz konfigurieren. Beim Herstellen einer Verbindung mit Ihren Daten oder beim Ziehen von Tabellen in den Bereich Schema wird dem Schema automatisch ein Eingabeschritt hinzugefügt. Dies ist immer der erste Schritt in einem Schema. Sie können mit der rechten Maustaste auf den Eingabeschritt klicken, um ihn umzubenennen oder zu entfernen. Wenn Sie mit einer Excel- oder Textdatei verbunden sind, können Sie auch die Daten aus dem Eingabeschritt aktualisieren. Weitere Informationen zum Aktualisieren von Daten im Eingabeschritt finden Sie unter Hinzufügen weiterer Daten im Eingabeschritt(Link opens in a new window).

Im Eingabeschritt können Sie die Einzelheiten zu Ihren Datensatz anzeigen. Hier können Sie Felder suchen, Beispielwerte anzeigen und Aktionen zum Reduzieren der Datensatzgröße durchführen. Sie können z. B. die einzubeziehenden Felder oder die zu verwendenden Datenstichproben auswählen oder Filter auf ausgewählte Felder oder Zeilen anwenden. Sie können auch die Feldeigenschaften konfigurieren, indem Sie den Feldnamen ändern oder die Texteinstellungen für die Textdateien konfigurieren.

Sie können den Datentyp auch im Eingabeschritt für Datenverbindungen ändern, die ihn unterstützen. Dazu gehören Microsoft Excel-, Text- und PDF-Dateien sowie Daten aus Box, Dropbox, Google Drive und OneDrive. Für andere Datenquellen können Sie den Datentyp in einem Bereinigungsschritt ändern. Weitere Informationen finden Sie unter Überprüfen der Ihren Daten zugeordneten Datentypen.

Hinweis: Feldwerte mit eckigen Klammern werden automatisch in normale Klammerzeichen konvertiert.

Herstellen einer Verbindung zu einer benutzerdefinierten SQL-Abfrage

Wenn Ihre Datenbank die Verwendung von benutzerdefinierter SQL unterstützt, wird Benutzerdefinierte SQL in der Nähe des unteren Randes des Bereichs Verbindungen angezeigt. Doppelklicken Sie auf Benutzerdefinierte SQL, um die Registerkarte Benutzerdefinierte SQL zu öffnen. Dort können Sie Abfragen für vorab ausgewählte Daten eingeben und quellenspezifische Vorgänge anwenden. Nachdem die Abfrage den Datensatz abgerufen hat, können Sie die einzubeziehenden Felder auswählen, Filter anwenden oder den Datentyp ändern, bevor Sie Ihrem Schema Daten hinzufügen.

Weitere Informationen zur Verwendung von benutzerdefiniertem SQL finden Sie unter Verbindung zu Daten mithilfe von benutzerdefinierter SQL.

Anwenden von Bereinigungsvorgängen in einem Eingabeschritt

In einem Eingabeschritt sind nur einige Bereinigungsvorgänge verfügbar. In der Eingabe-Feldliste können Sie die folgenden Änderungen vornehmen. Ihre Änderungen werden im Bereich Anpassungen nachverfolgt, und im Bereich Schema sowie in der Eingabe-Feldliste werden links neben dem Eingabeschritt Anmerkungen hinzugefügt.

  • Filter: Klicken Sie in der Symbolleiste auf Werte filtern und geben Sie dann im Berechnungs-Editor Ihre Filterkriterien ein.

  • Feld umbenennen: Doppelklicken bzw. Strg-Klick (bei MacOS) Sie im Feld Feldname auf den Feldnamen und geben Sie einen neuen Feldnamen ein.

  • Datentyp ändern: Klicken Sie auf den Datentyp für das Feld und wählen Sie im Menü einen neuen Datentyp aus.

  • Feld entfernen: Deaktivieren Sie das Kontrollkästchen neben den Feldern, die Sie nicht in Ihr Schema einbeziehen möchten.

Auswählen der in das Schema einzubeziehenden Feldern

Im Bereich Eingabe wird eine Liste mit Feldern in Ihrem Datensatz angezeigt. Mithilfe des Feldes Suche können Sie Felder in der Liste suchen. Anschließend können Sie die einzubeziehenden oder auszuschließenden Felder mithilfe der Kontrollkästchen auswählen. Wenn Sie alle Felder in das Schema einbeziehen oder daraus ausschließen möchten, aktivieren bzw. deaktivieren Sie das Kontrollkästchen oben links im Raster.

Anwenden von Filtern auf Felder im Eingabeschritt

Wenn Sie ein Feld filtern möchten, gehen Sie wie folgt vor:

  1. Klicken Sie in der Symbolleiste auf Werte filtern.

  2. Geben Sie im Berechnungs-Editor Ihre Filterkriterien ein.

Der Berechnungsfiltertyp ist die einzige im Eingabeschritt verfügbare Filteroption. Weitere Filtermöglichkeiten stehen in anderen Schritttypen zur Verfügung. Weitere Informationen finden Sie unter Filtern von Daten(Link opens in a new window).

Ändern von Feldnamen

Wenn Sie den Namen eines Feldes ändern möchten, wählen Sie in der Spalte Feldname den Namen aus, und geben Sie dann den neuen Namen in das Feld ein. Im Feldraster und im Bereich Schema links neben dem Eingabeschritt wird eine Anmerkung hinzugefügt. Ihre Änderungen werden auch im Anpassungsbereich verfolgt.

Ändern von Datentypen

Wenn Sie den Datentyp für ein Feld ändern möchten, gehen Sie wie folgt vor:

  1. Klicken Sie auf den Datentyp für das Feld.

  2. Wählen Sie im Menü den neuen Datentyp aus.

    Sie können auch den Datentyp für Felder in anderen Schritttypen im Schema ändern, oder Datenrollen zuordnen, um Ihre Feldwerte zu validieren. Weitere Informationen zum Ändern des Datentyps oder zur Verwendung von Datenrollen finden Sie unter Überprüfen der Ihren Daten zugeordneten Datentypen(Link opens in a new window) und Datenrollen zur Datenvalidierung verwenden(Link opens in a new window).

Konfigurieren von Feldeigenschaften

Wenn Sie mit Textdateien arbeiten, wird die Registerkarte Einstellungen angezeigt. Dort können Sie Ihre Verbindung bearbeiten und Texteigenschaften konfigurieren, beispielsweise das Feldtrennzeichen für Textdateien. Sie können die Dateiverbindung auch im Bereich "Verbindungen" bearbeiten oder Einstellungen für die inkrementelle Aktualisierung konfigurieren. Weitere Informationen zum Einrichten der inkrementellen Aktualisierung für Ihr Schema finden Sie unter Aktualisieren von Schemadaten mithilfe der inkrementellen Aktualisierung.

Wenn Sie mit Text- oder Excel-Dateien arbeiten, können Sie noch vor dem Starten des Schemas Datentypen korrigieren, die falsch abgeleitet wurden. Nach dem Starten des Schemas können Datentypen grundsätzlich in den Folgeschritten im Bereich Profil geändert werden.

Konfigurieren von Texteinstellungen in Textdateien

Wenn Sie die Einstellungen zum Analysieren von Textdateien ändern möchten, wählen Sie eine der folgenden Optionen aus:

  • Erste Zeile enthält Kopfzeile (Standard): Wählen Sie diese Option aus, um die erste Zeile als Feldbeschriftung zu verwenden.

  • Feldnamen automatisch generieren: Wählen Sie diese Option aus, wenn Tableau Prep Builder die Kopfzeilen für Felder automatisch generieren soll. Die Namenskonvention für Felder folgt demselben Modell wie Tableau Desktop. Beispiel: F1, F2 usw.

  • Feldtrennzeichen: Wählen Sie in der Liste ein Zeichen aus, das zum Trennen der Spalten verwendet werden soll. Wählen Sie Andere aus, um ein benutzerdefiniertes Zeichen einzugeben.

  • Textqualifizierer: Wählen Sie das Zeichen aus, das die Werte in die Datei einschließt.

  • Zeichensatz: Wählen Sie den Zeichensatz aus, der die Textdateicodierung beschreibt.

  • Gebietsschema: Wählen Sie das Gebietsschema aus, das zum Analysieren der Datei verwendet werden soll. Diese Einstellung gibt an, welche Dezimal- und Tausendertrennzeichen verwendet werden.

Festlegen der Stichprobengröße

Um die maximale Leistung beizubehalten, beschränkt Tableau Prep in das Schema einbezogenen Daten standardmäßig auf eine repräsentative Stichprobe Ihrer Daten. Die Stichprobe wird per Berechnung der optimalen Anzahl an Zeilen basierend auf der Gesamtzahl Felder im Datensatz und den Datentypen für diese Felder bestimmt. Anschließend ruft Tableau Prep schnellstmöglich die optimale Anzahl an Zeilen für die berechnete Menge ab.

Je nachdem, wie die Stichprobe berechnet und zurückgegeben wurde, kann die resultierende Stichprobe alle benötigten Zeilen enthalten oder nicht. Wenn die erwarteten Daten nicht angezeigt werden, können Sie die Stichprobeneinstellungen ändern, um die Abfrage erneut auszuführen.

Beim Erstellen oder Bearbeiten von Schemata im Web werden Grenzwerte auf die Datenmenge angewendet, die Sie in ein Schema einbeziehen können, und die verfügbaren Optionen zum Ändern des Datenbeispiels unterscheiden sich geringfügig von denen bei der Arbeit in Tableau Prep Builder. Weitere Informationen finden Sie unter Beispieldaten und Verarbeitungsgrenzen.

Hinweis: Wenn Stichproben Ihrer Daten gezogen werden, wird das Badge Stichproben () im Bereich Profil angezeigt. Dieser bleibt für alle von Ihnen hinzugefügten Schritte bestehen. Von Ihnen vorgenommene Änderungen werden auf die Stichprobe angewendet, mit der Sie im Schema arbeiten. Sämtliche Änderungen werden beim Ausführen des Schemas auf den gesamten Datensatz angewendet.

Wenn Sie die Stichprobeneinstellungen ändern möchten, wählen Sie einen Eingabeschritt aus, und wählen Sie dann auf der Registerkarte Stichprobe eine der folgenden Optionen aus:

  • Standard-Stichprobenmenge (Standard): Tableau Prep berechnet die Gesamtzahl zurückzugebender Zeilen.

  • Alle Daten verwenden (nur Tableau Prep Builder): Rufen Sie unabhängig von der Größe alle Zeilen in Ihrem Datensatz ab. Dies kann dazu führen, dass die Leistung beeinträchtigt wird oder dass für Tableau Prep Builder eine Zeitüberschreitung auftritt.

    Hinweis: Um die Leistung aufrechtzuerhalten, wird auch bei Auswahl dieser Einstellung eine Datenabtastgrenze von 1 Million Zeilen auf die Schritttypen Aggregieren und Verknüpfen, und eine Datenabtastgrenze von 3 Millionen Zeilen auf die Schritttypen Vereinigen und Pivotieren angewendet.

  • Feste Zeilenanzahl: Wählen Sie die Anzahl der aus dem Datensatz zurückzugebenden Zeilen aus. Die empfohlene Zeilenanzahl beträgt 1 Million Zeilen oder weniger. Wenn Sie die Zeilenanzahl auf mehr als 1 Million festlegen, kann dadurch die Leistung beeinträchtigt werden.

    • In der Webdokumenterstellung: Die maximale Anzahl von Zeilen, die ein Benutzer bei Verwendung großer Datensätze auswählen kann, wird vom Administrator konfiguriert. Als Benutzer können Sie die Anzahl der Zeilen bis zu diesem Grenzwert auswählen.
  • Schnellauswahl (Standard): Die Datenbank gibt die angeforderte Zeilenanzahl schnellstmöglich zurück. Dies können die ersten N Zeilen oder die Zeilen sein, die die Datenbank aus einer vorherigen Abfrage im Speicher zwischengespeichert hat.

  • Zufällige Stichprobe: Die Datenbank gibt die angeforderte Anzahl Zeilen zurück, sie untersucht jedoch alle Zeilen im Datensatz und gibt eine repräsentative Stichprobe aller Zeilen zurück. Beim ersten Abrufen der Daten kann diese Option die Leistung beeinträchtigen.

Vielen Dank für Ihr Feedback!