Extrahieren von Daten
Ein Datenextrakt ist eine Teilmenge von Informationen, die getrennt vom Originaldatensatz gespeichert wird. Ein Datenextrakt dient zwei Zwecken: der Verbesserung der Leistung und der Nutzung von Tableau-Funktionen, die in den Originaldaten möglicherweise nicht verfügbar sind oder unterstützt werden. Durch die Erstellung eines Datenextrakts können Sie das Gesamtdatenvolumen effektiv reduzieren, indem Sie Filter anwenden und andere Einschränkungen festlegen.
Nachdem ein Datenextrakt erstellt wurde, kann er mit aktuellen Daten aus der Originalquelle aktualisiert werden. Während des Aktualisierungsvorgangs können Sie entweder eine vollständige Aktualisierung auswählen und dadurch alle Inhalte im Extrakt ersetzen oder den Extrakt inkrementell aktualisieren, wodurch nur die seit der letzten Aktualisierung neuen Zeilen hinzugefügt werden.
Hinweis: Mit Version 2024.1 führt Tableau eine Funktion ein, die es Benutzern ermöglicht, inkrementelle Aktualisierungen von Extrakten mithilfe einer nicht eindeutigen Schlüsselspalte durchzuführen.
Vorteile von Extrakten
Verarbeitung großer Datensätze: Extrakte können riesige Datenmengen verarbeiten, sogar Milliarden von Zeilen. Dadurch können Benutzer effizient mit umfangreichen Datensätzen arbeiten.
Verbesserte Leistung: Die Interaktion mit Ansichten, die Extraktdatenquellen nutzen, führt zu einer besseren Leistung verglichen mit Ansichten, die direkt mit den Originaldaten verbunden sind. Extrakte optimieren die Abfrageleistung, was eine schnellere Datenanalyse und -visualisierung ermöglicht.
Erweiterte Funktionalität: Extrakte bieten Zugriff auf zusätzliche Tableau-Funktionen, die in der ursprünglichen Datenquelle möglicherweise nicht verfügbar sind oder von ihr nicht unterstützt werden.
Beispielsweise können Benutzer Extrakte nutzen, um den Wert "Anzahl (eindeutig)" zu berechnen und so erweiterte Berechnungen und Analysen zu ermöglichen.
Offline-Datenzugriff (Tableau Desktop): Extrakte ermöglichen den Offline-Zugriff auf Daten. Dies bedeutet, dass Benutzer die Daten auch dann lokal speichern, bearbeiten und verwenden können, wenn die ursprüngliche Datenquelle nicht verfügbar ist.
Erstellen eines Extraktes
In Ihrem Tableau-Workflow stehen mehrere Optionen zum Erstellen eines Extrakts zur Verfügung. Der beste Weg wird jedoch unten erläutert.
Wählen Sie nach dem Herstellen einer Verbindung zu Ihren Daten und Einrichten der Datenquelle auf der Seite "Datenquelle" in der oberen rechten Ecke die Option Extrakt aus und dann den Link Bearbeiten, um das Dialogfeld "Daten extrahieren" zu öffnen.
Wählen Sie unter "Datenspeicher" eine der beiden Optionen Logische Tabellen oder Physische Tabellen aus. Hilfe zu diesem Schritt finden Sie im Abschnitt Datenspeicher.
Erweitern Sie die Filter, um Filter zu definieren und dadurch die extrahierte Datenmenge anhand von Feldern und ihren Werten zu begrenzen.
Wählen Sie Daten für sichtbare Dimensionen aggregieren aus, um die Kennzahlen anhand ihrer Standardaggregation zusammenzufassen.
(Optional) Wählen Sie für Rollup für Daten bis eine bestimmte Datumsebene wie Jahr, Monat usw. aus.
Wählen Sie die Anzahl der Zeilen aus, die extrahiert werden sollen. Sie können Alle Zeilen, Beispiel oder die obersten N Zeilen extrahieren.
Aktivieren Sie das Kontrollkästchen für Inkrementelle Aktualisierung, geben Sie dann die Tabelle an, die Sie aktualisieren möchten, wählen Sie eine Spalte in der Datenbank aus, um die neuen Zeilen zu identifizieren, und legen Sie optional einen Mindestdatumsbereich für die Aktualisierung fest.
Wenn Sie fertig sind, wählen Sie Einstellungen speichern aus.
Wählen Sie die Registerkarte "Blatt" aus. Dadurch wird die Erstellung des Extrakts gestartet.
Wählen Sie als Nächstes einen Speicherort für den Extrakt aus.
Geben Sie einen Namen für die Extraktdatei ein.
Wählen Sie Speichern aus. Wenn das Dialogfeld "Speichern" nicht angezeigt wird, lesen Sie im Abschnitt Problembehebung bei Extrakten nach.
Extrakt-Feldbeschreibungen
Beim Erstellen eines Extrakts können Sie zahlreiche Felder konfigurieren. Dieser Abschnitt beschreibt die einzelnen Felder.
Datenspeicher
Unter "Datenspeicher" können Sie entweder logische oder physische Tabellen auswählen. Mit der Option "Logische Tabellen" werden Daten für jede logische Tabelle in der Datenquelle in einer einzigen Extrakttabelle gespeichert. Mit der Option "Physische Tabellen" werden Daten für jede physische Tabelle in der Datenquelle in einer einzigen Extrakttabelle gespeichert.
Logische Tabellen
Wenn Sie die Datenmenge in Ihrem Extrakt begrenzen und zusätzliche Extrakteigenschaften wie Filter, Aggregation oder Top N verwenden möchten, sollten Sie "Logische Tabellen" auswählen.
Diese Option funktioniert auch gut, wenn Ihre Daten Pass-Through-Funktionen (RAWSQL) enthalten.
Tableau verwendet logische Tabellen als Standardstruktur zum Speichern von Extraktdaten.
Wenn Sie diese Option verwenden und Ihr Extrakt Verknüpfungen enthält, werden die Verknüpfungen beim Erstellen des Extrakts angewendet.
Physische Tabellen
Wenn Ihr Extrakt aus Tabellen besteht, die mit Gleichheitsverknüpfungen kombiniert sind, und die Bedingungen für die Verwendung der Option "Physische Tabellen" erfüllt, sollten Sie "Physische Tabellen" auswählen. Mithilfe dieser Option werden Verknüpfungen zum Zeitpunkt der Abfrage ausgeführt. Dadurch kann die Leistung optimiert und die Größe der Extraktdatei reduziert werden.
Überlegungen zur Verwendung der Option "Physische Tabellen". Wenn Sie Ihren Extrakt mithilfe der Option "Physische Tabellen" speichern möchten, müssen die Daten in Ihrem Extrakt alle unten aufgeführten Bedingungen erfüllen.
Alle Verknüpfungen zwischen physischen Tabellen sind Gleichheitsverknüpfungen (=).
Die Datentypen der Spalten, die für Beziehungen und Verknüpfungen verwendet werden, sind identisch.
Es werden keine Pass-Through-Funktionen (RAWSQL) verwendet.
Es ist keine inkrementelle Aktualisierung konfiguriert.
Es sind keine Extraktfilter konfiguriert.
Es ist keine "Top N"- oder Stichproben-Konfiguration vorhanden.
Wenn der Extrakt mit der Option "Physische Tabellen" gespeichert wird, können keine Daten angehängt werden.
Bei logischen Tabellen können Sie keine Daten an Extrakte anhängen, die mehr als eine logische Tabelle aufweisen.
Tipps zur Verwendung der Option "Physische Tabellen"
Tableau empfiehlt beim Einrichten von und Arbeiten mit Extrakten generell die Verwendung der standardmäßigen Datenspeicherungsoption "Logische Tabellen". In vielen Fällen stehen Ihnen einige der für Ihren Extrakt benötigten Funktionen (wie Extraktfilter) nur dann zur Verfügung, wenn Sie die Option "Logische Tabellen" verwenden.
Option "Physische Tabellen" für Extrakte, die größer sind als erwartet
Die Option "Physische Tabellen" sollte sparsam und in speziellen Situationen verwendet werden, beispielsweise dann, wenn Ihre Datenquelle die entsprechenden Bedingungen erfüllt und Ihr Extrakt größer ist als erwartet. Wenn Sie herausfinden möchten, ob der Extrakt größer ist, als er sein sollte, muss die Summe der Zeilen im Extrakt mit der Option "Logische Tabellen" höher als die Summe der Zeilen aller kombinierten Tabellen vor der Extrakterstellung sein. Wenn diese Situation eintrifft, verwenden Sie stattdessen die Option "Physische Tabellen".
Alternative Filterungsvorschläge beim Verwenden der Option „Physische Tabellen“
Wenn Sie die Option „Physische Tabellen“ oder andere Optionen zum Reduzieren der Daten in Ihrem Extrakt verwenden (z. B. Extraktfilter), werden Aggregation, „Oberste N“ und „Stichproben“ deaktiviert. Wenn Sie die Daten in einem Extrakt, für den die Option „Physische Tabellen“ verwendet wird, reduzieren müssen, sollten Sie die Daten filtern, bevor sie in Tableau Desktop integriert werden, indem Sie einer der folgenden Methoden folgen:
Stellen Sie eine Verbindung zu Ihren Daten her, und definieren Sie Filter mithilfe von benutzerdefiniertem SQL
Anstatt eine Verbindung zu einer Datenbanktabelle herzustellen, stellen Sie stattdessen mithilfe von benutzerdefiniertem SQL eine Verbindung zu Ihren Daten her. Stellen Sie beim Erstellen Ihrer benutzerdefinierten SQL-Abfrage sicher, dass sie eine geeignete Filterstufe enthält, die zum Reduzieren der Daten in Ihrem Extrakt nötig ist. Weitere Informationen zu benutzerdefiniertem SQL in Tableau Desktop finden Sie unter Herstellen einer Verbindung zu einer benutzerdefinierten SQL-Abfrage.
Definieren einer Ansicht in der Datenbank
Wenn Sie über Schreibzugriff auf Ihre Datenbank verfügen, können Sie eine Datenbankansicht erstellen, die nur die für Ihren Extrakt benötigten Daten enthält. Anschließend können Sie in Tableau Desktop eine Verbindung zu der Datenbankansicht herstellen.
Sicherheit auf Zeilenebene mit Extrakten
Wenn Sie Extraktdaten auf Zeilenebene schützen möchten, sollten Sie dazu die Option "Physische Tabellen" verwenden. Weitere Informationen zur Sicherheit auf Zeilenebene in Tableau finden Sie unter "Beschränken des Zugriffs auf Datenzeilenebene".
Allgemeine Überlegungen zu Tabellen
Die Optionen "Logische Tabellen" und "Physische Tabellen" haben lediglich Einfluss darauf, wie die Daten in Ihrem Extrakt gespeichert werden. Sie haben aber keine Auswirkung darauf, wie die Tabellen in Ihrem Extrakt auf der Seite „Datenquelle“ angezeigt werden.
Angenommen, der Extrakt besteht aus einer logischen Tabelle, die drei physische Tabellen enthält.
Wenn Sie die Extraktdatei (.hypher), für die die Verwendung der Standardoption "Logische Tabellen" konfiguriert wurde, direkt öffnen, wird auf der Seite "Datenquelle" nur eine Tabelle aufgeführt.
Wenn Sie jedoch den Extrakt mithilfe der Datenquellenpaket-Datei (.tdsx) oder der Datenquellendatei (.tdsx) und der zugehörigen Extraktdatei (.hypher) öffnen, werden auf der Seite "Datenquelle" alle drei Tabellen angezeigt, aus denen der Extrakt besteht.
Filter
Verwenden Sie die Filterfunktion, um Filter zu definieren und dadurch die extrahierte Datenmenge anhand der Felder und ihrer Werte zu begrenzen.
Aggregation
Mit der Aggregation können Sie Kennzahlen aggregieren. Sie können auch die Option Rollup für Daten bis auswählen und eine Datumsebene wie Jahr, Monat usw. spezifizieren. Die nachfolgenden Beispiele zeigen, wie die Daten bei den einzelnen Aggregationsoptionen, die Sie auswählen können, extrahiert werden.
Originaldaten | Jeder Datensatz wird als separate Zeile angezeigt. Ihre Daten enthalten sieben Zeilen. | |
Aggregieren von Daten für sichtbare Dimensionen (kein Rollup) | Datensätze mit dem gleichen Datum und der gleichen Region wurden zu einer einzelnen Zeile aggregiert. Der Extrakt enthält fünf Zeilen. | |
Aggregieren von Daten für sichtbare Dimensionen (Rollup für Daten bis Monat) | Für die Datumswerte wurde ein Rollup auf die Monatsebene durchgeführt und Datensätze mit der gleichen Region wurden zu einer einzelnen Zeile aggregiert. Der Extrakt enthält drei Zeilen. |
Anzahl der Zeilen
Sie können alle Zeilen oder die obersten N Zeilen extrahieren. Tableau wendet zuerst alle Filter und Aggregationen an und extrahiert anschließend die Anzahl der Zeilen aus den gefilterten und aggregierten Ergebnissen. Welche Optionen zur Verfügung stehen, ist von der Art der Datenquelle abhängig, aus der der Extrakt erstellt wird. Möglicherweise wird die Option "Stichproben" im Dialogfeld "Daten extrahieren" nicht angezeigt, da einige Datenquellen keine Stichproben unterstützen.
Hinweis(e): Alle zuvor von Ihnen auf der Seite "Datenquelle" oder auf der Blattregisterkarte ausgeblendeten Felder werden aus dem Extrakt ausgeschlossen. Klicken Sie auf die Schaltfläche Alle nicht verwendeten Felder ausblenden, um die ausgeblendeten Felder aus dem Extrakt zu entfernen.
Inkrementelle Aktualisierung
Die meisten Datenquellen unterstützen inkrementelle Aktualisierungen. Anstatt den gesamten Extrakt zu aktualisieren, können Sie die Aktualisierung so konfigurieren, dass nur die Zeilen hinzugefügt werden, die seit der letzten Datenextraktion neu hinzugekommen sind.
Beispiel: Sie haben eine Datenquelle, die täglich mit neuen Verkaufstransaktionen aktualisiert wird. Anstatt jeden Tag den gesamten Extrakt neu zu erstellen, reicht es, die an diesem Tag neu hinzugekommenen Transaktionen hinzuzufügen.
Tipps zur inkrementellen Aktualisierung und zu erweiterten Einstellungen
In diesem Abschnitt erhalten Sie Tipps zur Vermeidung von Fehlern, die beim Einrichten dieser Funktionen auftreten können.
Inkrementelle Aktualisierung:
Wählen Sie unter "Anzahl der Zeilen" die Option Alle Zeilen aus.
Die inkrementelle Aktualisierung ist nicht verfügbar, wenn Sie die Aggregation aktivieren.
Erweiterte Einstellungen:
Erweiterte Einstellungen sind nicht mit Filtern kompatibel.
Tipps zu Extrakten
Speichern der Arbeitsmappe, um die Verbindung zum Extrakt beizubehalten
Nach der Erstellung eines Extrakts beginnt die Arbeitsmappe, die Extraktversion Ihrer Daten zu verwenden. Die Verbindung zu der Extraktversion Ihrer Daten wird jedoch erst gespeichert, wenn Sie die Arbeitsmappe speichern. Das bedeutet als, dass die Arbeitsmappe beim nächsten Öffnen eine Verbindung zur ursprünglichen Datenquelle herstellt, falls Sie die Arbeitsmappe schließen, ohne vorher zu speichern.
Umschalten zwischen Stichprobendaten und dem gesamten Extrakt
Wenn Sie mit einem großen Extrakt arbeiten, kann es hilfreich sein, eine kleinere Stichprobe der Daten zu erstellen. Dadurch können Sie eine Ansicht einrichten, ohne jedes Mal langwierige Abfragen ausführen zu müssen, wenn Sie ein Feld zu Ihrer Analyse hinzufügen. Sie können problemlos zwischen der Verwendung der Beispieldaten und der vollständigen Datenquelle wechseln, indem Sie die entsprechende Option im Menü "Daten" auswählen.
Keine direkte Verbindung mit dem Extrakt herstellen
Wenn Sie Extrakte auf Ihrem Computer speichern, können Sie über einen neuen Tableau Desktop eine direkte Verbindung zu ihnen herstellen. Doch dies wird aus folgenden Gründen nicht empfohlen:
- Die Namen der Tabellen könnten unterschiedlich sein. Extrakte verwenden eine spezielle Benennung, um sicherzustellen, dass jede Tabelle einen eindeutigen Namen hat, der möglicherweise schwer zu verstehen ist.
- Sie können den Extrakt nicht aktualisieren. Wenn Sie eine direkte Verbindung zu einem Extrakt herstellen, betrachtet Tableau ihn als die ursprüngliche Datenquelle und nicht als Kopie. Das bedeutet, dass Sie ihn nicht mit Ihrer ursprünglichen Datenquelle verknüpfen können.
- Die Struktur und Beziehungen zwischen Tabellen gehen verloren. Die Anordnung und Verbindungen zwischen Tabellen werden in der .tds-Datei gespeichert, und nicht in der .hyper-Datei. Wenn Sie eine direkte Verbindung zur .hyper-Datei herstellen, gehen diese Informationen deshalb verloren. Wenn Sie für den Extrakt den Speicher logischer Tabellen verwenden, werden keine Verweise auf die ursprünglichen physischen Tabellen angezeigt.
Verwenden Sie keinen Extrakt, wenn Sie eine virtuelle Verbindung mit Benutzerfunktionen in der Datenrichtlinie herstellen
Wenn eine virtuelle Verbindung eine Datenrichtlinie hat, die Benutzerfunktionen(Link wird in neuem Fenster geöffnet) enthält (zum Beispiel USERNAME()
), Sie von einer Arbeitsmappe oder Datenquelle aus eine Verbindung damit herstellen und dort einen Auszug erstellen, enthält der Auszug nur die Zeilen, die zum Zeitpunkt der Auszugserstellung der Datenrichtlinie für virtuelle Verbindungen entsprechen. Um die Vorteile einer virtuellen Verbindung mit Benutzerfunktionen in der Datenrichtlinie zu nutzen, verwenden Sie anstelle eines Extrakts eine Direktverbindung von der Arbeitsmappe oder Datenquelle zur virtuellen Verbindung.
Entfernen des Extrakts aus der Arbeitsmappe
Sie können einen Extrakt jederzeit entfernen, indem Sie die Extrakt-Datenquelle im Menü Daten und dann auswählen. Beim Entfernen eines Extrakts können Sie zwischen der Option Extrakt nur aus der Arbeitsmappe entfernen und der Option Extraktdatei entfernen und löschen wählen. Mit der letzteren Option wird der Extrakt aus Ihrer Festplatte gelöscht.
Anzeigen des Extraktverlaufs (Tableau Desktop)
Sie können das Datum der letzten Aktualisierung des Extrakts und andere Details einblenden, indem Sie eine Datenquelle im Menü Daten und anschließend auswählen.
Falls Sie eine Arbeitsmappe öffnen, die mit einem Extrakt gespeichert wurde, und Tableau den Extrakt nicht finden kann, wählen Sie eine der folgenden Optionen im Dialogfeld „Extrakt nicht gefunden“ aus, wenn Sie dazu aufgefordert werden:
Extrakt suchen: Wählen Sie diese Option aus, wenn der Extrakt vorhanden ist, jedoch nicht im Speicherort, an dem Tableau ihn ursprünglich gespeichert hat. Mit OK öffnen Sie das Dialogfeld "Datei öffnen", in dem Sie den neuen Speicherort der Extraktdatei angeben.
Extrakt entfernen: Wählen Sie diese Option aus, wenn Sie den Extrakt nicht mehr benötigen. Dies entspricht dem Schließen der Datenquelle. Alle geöffneten Arbeitsblätter, die auf die Datenquelle verweisen, werden gelöscht.
Extrakt deaktivieren: Es wird nicht der Extrakt selbst verwendet, sondern die ursprüngliche Datenquelle, aus der der Extrakt erstellt wurde.
Extrakt neu generieren: Der Extrakt wird neu erstellt. Alle Filter und sonstigen Anpassungen, die Sie ursprünglich beim Erstellen des Extrakts angegeben hatten, werden automatisch angewendet.
Problembehebung bei Extrakten
Das Erstellen eines Extrakts nimmt längere Zeit in Anspruch: Das Erstellen eines Extrakts kann je nach Größe der Datenquelle recht lange dauern. Nachdem Sie die Daten extrahiert und auf Ihrem Computer gespeichert haben, kann sich die Leistung jedoch verbessern.
Extrakt wurde nicht erstellt: Wenn der Datensatz sehr viele Spalten (z. B. Tausende) enthält, ist Tableau möglicherweise nicht in der Lage, den Extrakt zu erstellen. Wenn Sie Probleme feststellen, ziehen Sie in Betracht, weniger Spalten zu extrahieren oder die zugrunde liegenden Daten neu zu strukturieren.
Dialogfeld „Speichern“ wird nicht angezeigt oder es wird kein Extrakt einer .twbx-Arbeitsmappe erstellt: Wenn Sie Daten nach dem zuvor beschriebenen Verfahren aus einem Arbeitsmappenpaket extrahieren, wird das Dialogfeld „Speichern“ nicht angezeigt. Wenn ein Extrakt aus einem Arbeitsmappenpaket (.twbx) erstellt wird, wird die Datei mit dem Extrakt automatisch in dem mit dem Arbeitsmappenpaket verknüpften Dateipaket gespeichert. Wenn Sie auf eine Datei mit einem aus einem Arbeitsmappenpaket erstellten Extrakt zugreifen möchten, müssen Sie die Arbeitsmappe entpacken. Weitere Informationen finden Sie unter Arbeitsmappenpakete.
Aktualisierungen der Extrakt-Funktion
Datumsbereich (Unterbereich)
Ab Version 2024.2 verfügt die inkrementelle Aktualisierung in Tableau über eine neue Funktion namens „Subrange Refresh“ (Teilbereichsaktualisierung). Mit dieser Funktion können Benutzer einen Mindestdatumsbereich für die Aktualisierung von Extrakten angeben. So können Benutzer beispielsweise auswählen, dass die Daten der letzten 14 Tage ab dem Aktualisierungsdatum aktualisiert werden sollen. Durch diese Funktion können Benutzer die Aktualisierung von Extrakten beschleunigen und Kosten sparen, die andernfalls durch unnötige vollständige Extrakte entstehen würden.
Inkrementelle Aktualisierung
Mit Version 2024.1 führt Tableau eine Funktion ein, die es Benutzern ermöglicht, inkrementelle Aktualisierungen von Extrakten mithilfe einer nicht eindeutigen Schlüsselspalte durchzuführen. Eine neue Benutzeroberfläche ist verfügbar, die diese erweiterten Einstellungen unterstützt.
Dieses Update führt einen zusätzlichen Schritt in den Prozess ein. Während einer inkrementellen Aktualisierung entfernt Tableau zunächst Zeilen aus dem Extrakt, die mit dem zuvor erfassten höchsten Wert übereinstimmen. Anschließend fragt Tableau alle Zeilen ab, deren Wert größer oder gleich dem vorherigen höchsten Wert ist. Dieser Ansatz stellt sicher, dass neben allen neu hinzugefügten Zeilen auch alle gelöschten Zeilen berücksichtigt werden.
Extrakte im Internet
Ab Version 2020.4 sind Extrakte in der Webdokumenterstellung und im Inhaltsserver verfügbar. Es ist nicht erforderlich, Datenquellen mit Tableau Desktop zu extrahieren. Weitere Informationen finden Sie unter Erstellen von Extrakten im Web.
Logische und physische Tabellenextrakte
Mit der Einführung logischer und physischer Tabellen im Tableau-Datenmodell von Version 2020.2 haben sich die Extraktspeicheroptionen von einer einzelnen Tabelle und mehreren Tabellen zu logischen und physischen Tabellen geändert. Diese Optionen beschreiben besser, wie Extrakte gespeichert werden. Weitere Informationen finden Sie unter Extrahieren von Daten.
Veraltung des .tde-Formats
Hinweis: Ab März 2023 sind Extrakte im .tde-Format in Tableau Cloud, Tableau Public und Tableau Server (Version 2023.1.0) veraltet. Version 2024.2 ist die letzte Version, die Dateien im TDE-Format öffnen kann. Weitere Informationen finden Sie unter Extrahieren des Upgrades in das .hyper-Format.
Ab Version 10.5 wird bei der Erstellung eines Extrakts das .hyper-Format verwendet. Extrakte im .hyper-Format nutzen die verbesserte Daten-Engine, die eine schnellere Analyse- und Abfrageleistung bei größeren Datensätzen bietet.
Ebenso wird, wenn eine extraktbezogene Aufgabe für einen .tde-Extrakt mithilfe von Version 10.5 und höher ausgeführt wird, der Extrakt in einen .hyper-Extrakt konvertiert. Nach der Konvertierung eines .tde-Extrakts in einen .hyper-Extrakt kann dieser nicht zurück in einen .tde-Extrakt verwandelt werden. Weitere Informationen finden Sie unter Extrahieren des Upgrades in das .hyper-Format.
Änderungen an Werten und Markierungen in der Ansicht
Zum Verbessern der Extrakteffizienz und -skalierbarkeit können die Werte in Extrakten in den Versionen 10.5 und höher anders berechnet werden als in den Versionen 10.4 und früher. Änderungen an der Art und Weise, wie die Werte berechnet werden, können beeinflussen, wie Markierungen in Ihrer Ansicht ausgefüllt werden. In einigen seltenen Fällen können die Änderungen dazu führen, dass sich die Form Ihrer Ansicht ändert oder sie leer angezeigt wird. Diese Änderungen gelten auch für Datenquellen mit mehreren Verbindungen, Datenquellen, die Live-Verbindungen zu dateibasierten Datenquellen verwenden, Datenquellen, die mit Google Sheets-Daten verbunden sind, cloudbasierte Datenquellen, auf Extrakte beschränkte Datenquellen und WDC-Datenquellen.
Sehen Sie sich die nachfolgenden Abschnitte an, um sich einen Überblick über einige der Ansichtsänderungen in Version 2022.4 zu verschaffen.
Format von Datums- und Uhrzeitwerten
Ab Version 10.5 und später unterliegen Extrakte konsistenteren und strengeren Regeln in Bezug auf die Art und Weise, wie Datenstrings mit den Funktionen DATE, DATETIME und DATEPARSE interpretiert werden. Dies beeinflusst, wie Daten analysiert werden, bzw. die bei diesen Funktionen zulässigen Datenformate und Muster. Genauer gesagt können die Regeln wie folgt generalisiert werden:
- Daten werden nach Spalte ausgewertet und analysiert, nicht nach Zeile.
- Die Auswertung und Analyse der Daten erfolgt nach dem Gebietsschema, in dem die Arbeitsmappe erstellt wurde, und nicht nach dem Gebietsschema des Computers, auf dem die Arbeitsmappe geöffnet wird.
Diese neuen Regeln führen zu effizienteren Extrakten und zu Ergebnissen, die mit kommerziellen Datenbanken konsistent sind.
Jedoch sehen Sie aufgrund dieser Regeln möglicherweise, dass 1. die Datums- sowie Datums- und Uhrzeitwerte in andere Datums- sowie Datums- und Uhrzeitwerte geändert werden oder 2. die Datums- sowie Datums- und Uhrzeitwerte in Null geändert werden – dies gilt insbesondere in internationalen Szenarien, in denen die Arbeitsmappe nicht im selben Gebietsschema geöffnet wird, in dem sie erstellt wurde, oder auf dem Server, auf dem die Arbeitsmappe veröffentlicht wurde: Wenn Ihre Datums- sowie Datums- und Uhrzeitwerte in andere Datums- sowie Datums- und Uhrzeitwerte geändert werden oder die Werte Null sind, deutet dies häufig darauf hin, dass es Probleme mit den zugrunde liegenden Daten gibt.
Nachfolgend finden Sie einige häufige Gründe dafür, warum es in Version 10.5 und späteren Versionen Änderungen an den Datums- sowie Datums- und Uhrzeitwerten in Ihrer Extrakt-Datenquelle geben kann.
Häufige Gründe für Änderungen an Datums-/Datums- und Uhrzeitwerten | Häufige Gründe für den Wert null |
---|---|
|
|
Datumsszenario 1
Angenommen, Sie verfügen über eine in einem englischen Gebietsschema erstellte Arbeitsmappe, die eine .tde-Extraktdatenquelle verwendet. Die nachfolgende Tabelle zeigt eine Spalte mit Zeichenfolgendaten, die in der Extraktdatenquelle enthalten sind.
10/31/2018 |
31/10/2018 |
12/10/2018 |
In Abhängigkeit des bestimmten englischen Gebietsschemas wurde das Format der Datumsspalte so festgelegt, dass es das MTJ-Format (Monat, Tag und Jahr) befolgt. Die folgende Tabelle zeigt, was Tableau basierend auf diesem Gebietsschema anzeigt, wenn die Funktion DATE verwendet wird, um Zeichenfolgenwerte in Datenwerte umzuwandeln.
October 31, 2018 |
October 31, 2018 |
December 10, 2018 |
Wenn der Extrakt in einem deutschen Gebietsschema geöffnet wird, wird Folgendes angezeigt:
31 Oktober 2018 |
31 Oktober 2018 |
12 Oktober 2018 |
Nachdem der Extrakt jedoch mithilfe Version 10.5 und höher in einem deutschen Gebietsschema geöffnet wurde, wird das TMJ-Format (Tag, Monat und Jahr) des deutschen Gebietsschemas streng durchgesetzt und verursacht einen NULL-Wert, da einer der Werte nicht dem TMJ-Format folgt.
Null |
October 31, 2018 |
October 12, 2018 |
Datumsszenario 2
Angenommen, Sie verfügen über eine weitere in einem englischen Gebietsschema erstellte Arbeitsmappe, die eine .tde-Extraktdatenquelle verwendet. Die nachfolgende Tabelle zeigt eine Spalte mit numerischen Datumswerten, die in der Extraktdatenquelle enthalten sind..
1112018 |
1212018 |
1312018 |
1412018 |
In Abhängigkeit des bestimmten englischen Gebietsschemas wurde das Format der Datumsspalte so festgelegt, dass es das MTJ-Format (Monat, Tag und Jahr) befolgt. Die folgende Tabelle zeigt, was Tableau basierend auf diesem Gebietsschema anzeigt, wenn die Funktion DATE verwendet wird, um die numerischen Werten in Datumswerte umzuwandeln.
11/1/2018 |
12/1/2018 |
Null |
Null |
Datumsszenario 3
Angenommen, Sie verfügen über eine Arbeitsmappe, die eine .tde-Extraktdatenquelle verwendet. Die nachfolgende Tabelle zeigt eine Spalte mit Zeichenfolgendaten, die in der Extraktdatenquelle enthalten sind.
2018-10-31 |
2018-31-10 |
2018-12-10 |
2018-10-12 |
Da für das Datum das ISO-Format verwendet wird, folgt die Datumsspalte stets dem Format JJJJ-MM-TT. Die folgenden Tabellen zeigen, was Tableau anzeigt, wenn die Funktion DATE verwendet wird, um Zeichenfolgenwerte in Datumswerte umzuwandeln.
October 10, 2018 |
Null |
December 10, 2018 |
October 12, 2018 |
Hinweis: In den Versionen 10.4 (und früher) war es möglich, dass das ISO-Format und andere Datumsformate je nach Gebietsschema, in dem die Arbeitsmappe erstellt wurde, unterschiedliche Ergebnisse erzeugten. In einem englischen Gebietsschema konnten beispielsweise die Zeichenfolgen 2018-12-10 und 2018/12/10 zu der Angabe December 12, 2018 führen. In einem deutschen Gebietsschema konnte jedoch der Ausdruck 2018-12-10 in 12. Dezember 2018 und der Ausdruck 2018/12/10 in 12. Oktober 2018 resultieren.
Sortierreihenfolge und Groß-/Kleinschreibung
Extrakte unterstützen die Sortierung und können daher Zeichenfolgenwerte angemessener sortieren, die Akzentzeichen oder unterschiedliche Groß-/Kleinschreibung aufweisen.
Beispiel: Angenommen, Sie haben eine Tabelle mit Stringwerten. In Bezug auf die Sortierreihenfolge bedeutet das, dass Zeichenfolgenwerte wie Réunion nach dem Upgrade Ihres Extrakts hinter Ruanda, aber vor Sambia aufgeführt werden.
Informationen zu Excel-Daten:
Im Hinblick auf die Groß-/Kleinschreibung bedeutet dies, dass sich die Art und Weise, in der Tableau Werte speichert, zwischen Version 10.4 (und früheren Versionen) und Version 10.5 (und höheren Versionen) geändert hat. Die Regeln für das Sortieren und Vergleichen von Werten haben sich dagegen nicht geändert. In Version 10.4 (und früheren Versionen) werden Zeichenfolgenwerte wie "Haus", "HAUS" und "hauS" gleich behandelt und mit einem repräsentativen Wert gespeichert. In Version 10.5 (und höheren Versionen) werden dieselben Zeichenfolgenwerte jeweils als einzigartig angesehen und somit als einzelne Werte gespeichert. Weitere Informationen finden Sie unter Ändern der Art, wie Werte berechnet werden.
Auflösen von Verbindungen in Abfragen der "Obersten N"
Wenn eine Abfrage der "Obersten N" in Ihrem Extrakt duplizierte Werte für eine bestimmte Position in einer Reihe hervorruft, kann die Position, welche die Verbindung auflöst, bei der Verwendung von Version 10.5 und höher eine andere sein. Beispiel: Angenommen, Sie erstellen einen Filter "Oberste 3". Die Positionen 3, 4 und 5 haben dieselben Werte. Bei der Verwendung von Version 10.4 und früheren Versionen kann der Filter "Oberste" die Positionen 1, 2 und 3 zurückgeben. Bei Verwendung von Version 10.5 und höher kann der Filter "Oberste" jedoch die Positionen 1, 2 und 5 zurückgeben.
Genauigkeit von Gleitkommawerten
Extrakte können den Durchschnitt der verfügbaren Hardwareressourcen auf einem Computer besser berechnen. Zudem können sie dadurch Rechenoperationen auf hochgradig parallele Art und Weise ausführen. Daher können reelle Zahlen durch .hyper-Extrakte in unterschiedlicher Reihenfolge aggregiert werden. Wenn Zahlen in unterschiedlicher Reihenfolge aggregiert werden, werden beim Berechnen der Aggregation hinter dem Dezimaltrennzeichen ggf. unterschiedliche Werte in Ihrer Ansicht angezeigt, da die Addition und Multiplikation von Gleitkommawerten nicht zwangsläufig assoziativ sein muss. Demzufolge ist „(a + b) + c“ nicht zwangsläufig mit „a + (b + c)“ identisch. Reelle Zahlen können darüber hinaus in unterschiedlicher Reihenfolge aggregiert werden, da die Multiplikation von Gleitkommawerten nicht zwangsläufig distributiv sein muss. Daher entspricht „(a x b) x c“ nicht zwangsläufig „a x b x c“. Dieser Gleitkommazahl-Rundungsverhaltenstyp in .hyper-Extrakten ähnelt dem Gleitkommazahl-Rundungsverhalten in kommerziellen Datenbanken.
Beispiel: Angenommen, Ihre Arbeitsmappe enthält einen Schieberegler-Filter für ein aggregiertes Feld, das aus Gleitkommawerten besteht. Da sich die Genauigkeit von Gleitkommawerten verändert hat, schließt der Filter jetzt unter Umständen eine Markierung aus, die die Ober- oder Untergrenze des Filterbereichs definiert. Das Fehlen dieser Zahlen führt möglicherweise zu einer leeren Ansicht. Um dieses Problem zu beheben, bewegen Sie den Schieberegler des Filters oder entfernen Sie den Filter und wenden Sie ihn erneut an.
Genauigkeit der Aggregationen
Extrakte werden für große Datensätze optimiert, indem sie die auf einem Computer verfügbaren Hardwareressourcen besser nutzen. So sind sie in der Lage, Aggregationen auf hochgradig parallele Art und Weise zu berechnen. Daher können von .hyper-Extrakten ausgeführte Aggregationen den Ergebnissen aus kommerziellen Datenbanken eher als den Ergebnissen aus Software ähneln, die speziell für statistische Berechnungen konzipiert ist. Wenn Sie einen kleinen Datensatz verwenden oder eine höhere Genauigkeitsebene benötigen, sollten Sie die Aggregationen ggf. über Referenzlinien, Zusammenfassungskartenstatistiken oder Tabellen-Berechnungsfunktionen wie Varianz, Standardabweichung, Korrelation oder Kovarianz ausführen.
Informationen zur Option "Berechnungen jetzt durchführen" für Extrakte
Wenn die Option Berechnungen jetzt durchführen in einem .tde-Extrakt mit einer vorherigen Version von Tableau Desktop verwendet wurde, wurden bestimmte berechnete Felder materialisiert und daher im Voraus berechnet und im Extrakt gespeichert. Wird der Extrakt von einem .tde-Extrakt in ein .hyper-Extrakt konvertiert, werden die zuvor materialisierten Berechnungen in Ihrem Extrakt nicht mit eingeschlossen. Sie müssen die Option Berechnungen jetzt durchführen erneut verwenden, um sicherzustellen, dass materialisierte Berechnungen nach der Extraktkonvertierung Teil des Extrakts sind. Weitere Informationen finden Sie unter Materialisieren von Berechnungen in Ihren Extrakten.
Neue Extrakt-API
Sie können die Extrakt-API 2.0 verwenden, um .hyper-Extrakte zu erstellen. Für zuvor mit dem Tableau-SDK durchgeführte Aufgaben wie das Veröffentlichen von Extrakten können Sie die Tableau Server REST API oder die Tableau Server-Clientbibliothek (Python) verwenden. Für Aktualisierungsaufgaben können Sie auch die Tableau Server REST API verwenden. Weitere Informationen finden Sie unter Tableau Hyper-API.