Erstellen von Extrakten im Web
Sie können Ihre Datenquellen im Web extrahieren (ohne Tableau Desktop zu verwenden), um die Datenquellenleistung zu verbessern und zusätzliche Analysefunktionen zu unterstützen. Wenn Sie Ihre Datenquelle extrahieren, kopiert Tableau die Daten aus Ihrem Remote-Datenspeicher nach Tableau Server oder Tableau Cloud. Weitere Informationen zu den Vorteilen des Extrahierens Ihrer Daten finden Sie unter Extrahieren Ihrer Daten. Im Web können Sie während der Webdokumenterstellung oder über den Inhaltsserver extrahieren.
Erstellen von Extrakten in der Webdokumenterstellung
Mithilfe der Standardextrakteinstellungen können Sie nun Extrakte direkt in der Webdokumenterstellung erstellen.
Extrahieren einer eingebetteten Datenquelle in der Webdokumenterstellung
Führen Sie die folgenden Schritte aus, um in der Webdokumenterstellung einen Extrakt zu erstellen.
Tipp: Es wird empfohlen, das Datenmodell fertigzustellen, bevor Sie den Extrakt erstellen. Die Extrakterstellung kann viel Zeit in Anspruch nehmen, und durch Änderungen am Datenmodell, z. B. durch das Hinzufügen neuer logischer Tabellen, wird den Extrakt ungültig.
- Wählen Sie in der unteren linken Ecke des Bereichs für die Webdokumenterstellung die Registerkarte Datenquelle aus. Bei neuen Arbeitsmappen beginnen Sie auf der Registerkarte Datenquelle.
- Ändern Sie in der rechten oberen Ecke den Verbindungstyp von Live in Extrakt.
- Wählen Sie Extrakt erstellen aus. Das Dialogfeld Extrakt erstellen wird angezeigt.
Die Extrakterstellung kann viel Zeit in Anspruch nehmen, und Sie können die Dokumenterstellungssitzung schließen, während der Extrakt erstellt wird. Um sicherzustellen, dass die Extrakterstellung nicht verloren geht, wählen Sie im Dialogfeld Bei Abschluss benachrichtigen, um einen Speicherort für die extrahierte Arbeitsmappe anzugeben. Wenn ihr Extrakt erfolgreich ist, wird Ihre Arbeitsmappe an dem angegebenen Speicherort gespeichert, und Sie werden benachrichtigt, dass Sie die Webdokument-Erstellungssitzung fortsetzen können.
Wenn die Extrakterstellung fehlschlägt, werden Sie benachrichtigt, dass der Extrakt nicht erstellt werden konnte. Sie können dann die nicht gespeicherten Änderungen wiederherstellen, indem Sie die ursprüngliche Arbeitsmappe in der Webdokumenterstellung erneut öffnen.
Definieren Ihrer Extrakteinstellungen
Sie können eine oder mehrere der folgenden Optionen konfigurieren, um Tableau anzuweisen, wie die Daten in Ihrem Extrakt gespeichert und wie Filter dafür definiert werden sollen und wie die Datenmenge darin begrenzt werden soll.
Festlegen, wie Extraktdaten gespeichert werden sollen
Sie können festlegen, dass Tableau die Daten mithilfe einer von zwei Strukturen (Schemata) in Ihrem Extrakt speichert: logischer Tabellen (denormalisiertes Schema) oder physischer Tabellen (normalisiertes Schema). Weitere Informationen zu logischen und physischen Tabellen finden Sie unter Das Tableau-Datenmodell. Die von Ihnen ausgewählte Option ist von den jeweiligen Anforderungen abhängig.
Logische Tabellen
Logische Tabellen speichern Daten mithilfe jeweils einer Extrakttabelle für jede logische Tabelle in der Datenquelle. Physische Tabellen, die eine logische Tabelle definieren, werden zusammengeführt und mit dieser logischen Tabelle gespeichert. Wenn z. B. eine Datenquelle aus einer einzelnen logischen Tabelle besteht, werden die Daten in einer einzelnen Tabelle gespeichert.
Wenn eine Datenquelle aus drei logischen Tabellen besteht (jede enthält mehrere physische Tabellen), werden die Extraktdaten in drei Tabellen gespeichert – eine für jede logische Tabelle.
Wählen Sie Logische Tabellen wenn Sie die Datenmenge in Ihrem Extrakt mit zusätzlichen Extrakteigenschaften wie Extraktfilter, Aggregation, "Oberste N" oder anderen Features begrenzen möchten, die denormalisierte Daten erfordern. Sie können dies auch verwenden, wenn Ihre Daten Pass-Through-Funktionen (RAWSQL) nutzen. Dies ist die Standardstruktur, die Tableau zum Speichern von Extraktdaten verwendet.
Wenn Sie diese Option verwenden und Ihr Extrakt Verknüpfungen enthält, werden die Verknüpfungen beim Erstellen des Extrakts angewendet.
Physische Tabellen
Physische Tabellen speichern Daten mithilfe jeweils einer Extrakttabelle für jede physische Tabelle in der Datenquelle.
Wählen Sie Physische Tabellen, wenn Ihr Extrakt aus Tabellen besteht, die mit einer oder mehreren Gleichheitsverknüpfungen kombiniert sind, und die unten aufgeführten Bedingungen für die Verwendung der Option "Physische Tabellen" erfüllt. Bei Verwendung dieser Option erfolgen die Verknüpfungen zur Abfragezeit.
Mithilfe dieser Option können die Leistung optimiert und die Größe der Extraktdatei reduziert werden. Weitere Informationen darüber, wie Tableau Ihnen die Verwendung der Option "Physische Tabellen" empfiehlt, finden Sie unter Tipps zur Verwendung der Option "Physische Tabellen“ in der Tableau Desktop-Hilfe.
In einigen Fällen können Sie diese Option auch als Umgehung der Sicherheit auf Zeilenebene verwenden. Weitere Informationen zur Sicherheit auf Zeilenebene bei der Verwendung von Tableau finden Sie in the der Tableau Desktop-Hilfe unter Beschränken des Zugriffs auf Datenzeilenebene.
Bedingungen zum Verwenden der Option "Physische Tabellen"
Wenn Sie Ihren Extrakt mithilfe der Option "Physische Tabellen" speichern möchten, müssen die Daten in Ihrem Extrakt alle unten aufgeführten Bedingungen erfüllen.
- Alle Verknüpfungen zwischen physischen Tabellen sind Gleichheitsverknüpfungen (=).
- Die Datentypen der Spalten, die für Beziehungen und Verknüpfungen verwendet werden, sind identisch.
- Es werden keine Pass-Through-Funktionen (RAWSQL) verwendet.
- Es ist keine inkrementelle Aktualisierung konfiguriert.
- Es sind keine Extraktfilter konfiguriert.
- Es ist keine "Top N"- oder Stichproben-Konfiguration vorhanden.
- Wenn der Extrakt mit der Option „Physische Tabellen“ gespeichert wird, können keine Daten angehängt werden.
- Bei logischen Tabellen können Sie keine Daten an Extrakte anhängen, die mehr als eine logische Tabelle aufweisen.
Hinweis: Die Optionen "Logische Tabellen" und "Physische Tabellen" haben lediglich Einfluss darauf, wie die Daten in Ihrem Extrakt gespeichert werden. Sie haben aber keine Auswirkung darauf, wie die Tabellen in Ihrem Extrakt auf der Seite "Datenquelle" angezeigt werden.
Festlegen, wie viele Daten extrahiert werden
Wählen Sie Hinzufügen aus, um einen oder mehrere Filter zu definieren und dadurch die extrahierte Datenmenge auf Basis der Felder und ihrer Werte zu begrenzen.
Aggregieren der Daten im Extrakt
Wählen Sie Daten für sichtbare Dimensionen aggregieren aus, um die Kennzahlen anhand ihrer Standardaggregation zusammenzufassen. Durch Aggregieren der Daten werden Zeilen zusammengefasst, wodurch die Größe der Extraktdatei verringert und die Leistung gesteigert werden kann.
Wenn Sie sich für das Aggregieren der Daten entscheiden, können Sie auch die Option Rollup für Daten auswählen und eine Datumsebene wie Jahr, Monat usw. angeben. Die nachfolgenden Beispiele zeigen, wie die Daten bei den einzelnen Aggregationsoptionen, die Sie auswählen können, extrahiert werden.
Originaldaten Jeder Datensatz wird als separate Zeile angezeigt. Ihre Daten enthalten sieben Zeilen. Aggregieren von Daten für sichtbare Dimensionen (kein Rollup)
Datensätze mit dem gleichen Datum und der gleichen Region wurden zu einer einzelnen Zeile aggregiert. Der Extrakt enthält fünf Zeilen. Aggregieren von Daten für sichtbare Dimensionen
(Rollup für Daten bis Monat)Für die Datumswerte wurde ein Rollup auf die Monatsebene durchgeführt und Datensätze mit der gleichen Region wurden zu einer einzelnen Zeile aggregiert. Der Extrakt enthält drei Zeilen. Nicht alle Datenquellen unterstützen Stichproben. Daher kann es sein, dass Ihnen die Option „Stichproben“ im Dialogfeld „Daten extrahieren“ nicht angezeigt wird.
Alle zuvor von Ihnen auf der Seite "Datenquelle" auf der Blattregisterkarte ausgeblendeten Felder werden aus dem Extrakt ausgeschlossen.
Auswählen der zu extrahierenden Zeilen
Wählen Sie die Anzahl der Zeilen aus, die extrahiert werden sollen.
Sie können alle Zeilen oder die obersten N Zeilen extrahieren. Tableau wendet zuerst alle Filter und Aggregationen an und extrahiert anschließend die Anzahl der Zeilen aus den gefilterten und aggregierten Ergebnissen. Welche Optionen zur Verfügung stehen, ist von der Art der Datenquelle abhängig, aus der der Extrakt erstellt wird.
Hinweise:
Konfigurieren von Einstellungen für inkrementelle Aktualisierung
Die meisten Datenquellen unterstützen inkrementelle Aktualisierungen. Anstatt den gesamten Extrakt zu aktualisieren, können Sie die Aktualisierung so konfigurieren, dass nur die Zeilen hinzugefügt werden, die seit der letzten Datenextraktion neu hinzugekommen sind.
Beispiel: Sie haben eine Datenquelle, die täglich mit neuen Verkaufstransaktionen aktualisiert wird. Anstatt jeden Tag den gesamten Extrakt neu zu erstellen, können Sie einfach die an diesem Tag neu hinzugekommenen Transaktionen hinzufügen. Damit „Inkrementell“ beim Planen als Option angeboten wird, müssen Sie zunächst die Einstellungen definieren.
Sie können in regelmäßigen Abständen eine vollständige Aktualisierung durchführen, um sicherzustellen, dass Sie über die aktuellsten Daten verfügen.
Hinweis: Wenn sich die Datenstruktur der Quelldaten ändert (z. B. eine neue Spalte hinzugefügt wird), müssen Sie eine vollständige Extraktaktualisierung vornehmen, bevor Sie erneut mit inkrementellen Aktualisierungen beginnen können.
Einrichten inkrementeller Aktualisierungen
Aktivieren Sie das Kontrollkästchen Inkrementelle Aktualisierung.
Wählen Sie eine Tabelle zum Aktualisieren aus.
Wählen Sie eine Spalte aus, die zum Identifizieren neuer Zeilen verwendet werden soll.
Geben Sie in Minimaler zu aktualisierender Datumsbereich einen Unterdatumsbereich ein. Sie haben die Möglichkeit, in diesem Feld einen bestimmten Zeitraum in Tagen, Stunden, Minuten oder Sekunden auszuwählen.
Führen Sie die folgenden Schritte aus, um einen Extrakt einzurichten, der inkrementell aktualisiert werden soll. Stellen Sie jedoch zunächst sicher, dass Sie „Alle Zeilen“ als Anzahl der zu extrahierenden Zeilen ausgewählt haben.
Die inkrementelle Aktualisierung kann nur festgelegt werden, wenn alle Zeilen aus der Datenbank extrahiert werden. Ein Stichprobenextrakt kann nicht inkrementiert werden.
Wenn Benutzer beispielsweise eine Datums- oder Datumszeitspalte in Tableau auswählen, können sie die extrahierten Daten innerhalb eines angegebenen Zeitraums aktualisieren, z. B. 14 Tage ab dem Aktualisierungsdatum. Diese Funktion ist für Datenquellen von Vorteil, die Einfügungen und nachträgliche Änderungen innerhalb eines definierten Zeitraums zulassen. Durch die inkrementelle Extraktaktualisierung können Benutzer diese Änderungen zusammen mit allen neuen Daten effizient erfassen.
Sie können keine Extrakte für eingebettete Datenquellen erstellen, die auf veröffentlichte Datenquellen verweisen. Erstellen Sie den Extrakt als Problemumgehung direkt in der veröffentlichten Datenquelle. Weitere Informationen finden Sie unter „Extrahieren einer veröffentlichten Datenquelle auf dem Inhaltsserver“.
Für dateibasierte Datenquellen können keine Extrakte erstellt werden. Dateibasierte Datenquellen verfügen bereits über spezielle Leistungsmerkmale, und das Hinzufügen der Extraktion hat keinen Leistungsvorteil.
Diese Funktion gilt nicht für auf Bridge basierende Datenquellen in Tableau Cloud.
Einschränkung bezüglich benutzerdefinierter SQL: Benutzerdefinierte SQL-Abfragen werden bei erweiterten Einstellungen nicht unterstützt. Benutzer, die auf benutzerdefinierte SQL angewiesen sind, müssen ihre Vorgehensweise anpassen, wenn sie die erweiterten Einstellungen für inkrementelle Aktualisierung verwenden möchten.
Verwenden der erweiterten Einstellungen
Erweitern Sie Erweiterte Einstellungen, um festzulegen, wie neue Zeilen abgerufen werden.
Hinweis: Wenn Sie einen Mindestdatumsbereich für die Aktualisierung festgelegt haben, ist der Zugriff auf die Funktion „Erweiterte Einstellungen“ nicht möglich.
Per „Erweiterte Einstellungen“ können Sie entweder die zuletzt hinzugefügten Zeilen ersetzen lassen, indem Werte aktualisiert werden, die gleich oder größer als der zuletzt aufgezeichnete Wert sind, oder die zuletzt hinzugefügten Zeilen beibehalten lassen, indem der Extrakt nur mit Werten aktualisiert wird, die größer als der zuletzt aufgezeichnete Wert sind.
Mit der erstgenannten Methode ermöglicht Tableau es Benutzern, Extrakte mit einer nicht eindeutigen Schlüsselspalte (wie Datum, Datum/Uhrzeit oder ID) inkrementell zu aktualisieren.
Diese Methode fügt beim Durchführen einer inkrementellen Aktualisierung einen neuen Schritt hinzu. Tableau löscht zunächst Zeilen in dem Extrakt, die gleich dem bislang höchsten gesehenen Wert sind. Dann fragt Tableau alle Zeilen ab, die größer oder gleich dem bisherigen Höchstwert sind, wodurch alle gelöschten und sämtliche neuen Zeilen erfasst werden.
Umgekehrt können Sie auch festlegen, dass die zuletzt hinzugefügten Zeilen nicht ersetzt und nur Zeilen hinzugefügt werden sollen, deren Werte größer als der zuletzt erfasste Wert sind.
Wählen Sie zum Abschluss Extrakt erstellen aus.
Aspekte beim Durchführen einer inkrementellen Aktualisierung
Bearbeiten eines Extrakts:
Wenn Sie einen bestehenden Extrakt bearbeiten, wird die letzte Aktualisierung angezeigt, damit Sie sichergehen können, dass Sie den Extrakt mit den richtigen Daten aktualisieren.
Vollständige Aktualisierung:
Bei einer vollständigen Aktualisierung werden bei jeder Aktualisierung des Extrakts alle Zeilen durch die Daten in der ursprünglichen Datenquelle ersetzt. Eine vollständige Aktualisierung kann länger dauern und die Datenbank stärker auslasten.
Daten-Engine
Die Daten-Engine (d. h. der zugrunde liegende Mechanismus, den Tableau nutzt, um Extrakte zu erstellen) speichert Zeitwerte mit einer Präzision von bis zu 3 Dezimalstellen.
Wenn Sie für „Neue Zeilen über Spalte identifizieren“ eine Spalte vom Typ „Datum/Uhrzeit“ oder „Zeitstempel“ angeben und in der Datenbank eine höhere Genauigkeit als in Tableau verwendet wird, kann das dazu führen, dass Zeilen nach einer inkrementellen Aktualisierung doppelt vorhanden sind.
Beispiel: Wenn in der Datenbank zwei Zeilen vorhanden sind – die eine mit dem Datum/Uhrzeit-Wert „2015-03-13 17:30:56.502352“ und die andere mit „2015-03-13 17:30:56.502852“, wird Tableau beide Zeilen unter Verwendung des Datum/Uhrzeit-Wertes „2015-03-13 17:30:56.502“ speichern, wodurch die Zeile doppelt vorhanden ist.
Einschränkungen
Erstellen von Extrakten auf dem Inhaltsserver
Extrahieren einer veröffentlichten Datenquelle auf dem Inhaltsserver
Führen Sie die folgenden Schritte aus, um eine veröffentlichte Datenquelle zu extrahieren.
- Melden Sie sich als Administrator oder als Besitzer der Datenquelle an.
- Wählen Sie auf der Registerkarte „Inhalt“ die Optionen Erkunden und dann Datenquellen aus.
- Wählen Sie eine Datenquelle aus, indem Sie auf den Namen der Datenquelle klicken.
- Wählen Sie am oberen Rand des Bildschirms unter dem Namen der Datenquelle das Dropdown-Menü mit der Angabe Live aus.
- Ändern Sie den Verbindungstyp von Direkt zu Extrakt. Wenn die Funktion "Extrahieren der Verschlüsselung im Ruhezustand" auf der Site aktiviert ist, wählen Sie entweder Verschlüsselt oder Unverschlüsseltaus.
- Wenn eine Fehlermeldung zu eingebetteten Anmeldeinformationen angezeigt wird, betten Sie Ihre Anmeldeinformationen in die Datenquelle ein. Wählen Sie dazu Verbindung bearbeiten aus. Wählen Sie „Eingebettetes Kennwort in der Verbindung“ und dann Speichern aus.
Extrahieren einer eingebetteten Datenquelle auf dem Inhaltsserver
Führen Sie die folgenden Schritte aus, um eine oder mehrere Datenquellen zu extrahieren, die in eine veröffentlichte Arbeitsmappe eingebettet sind.
- Melden Sie sich als Administrator oder als Besitzer der Datenquelle an.
- Navigieren Sie zur veröffentlichten Arbeitsmappe.
- Navigieren Sie zur Registerkarte "Datenquellen".
- Wählen Sie eine oder mehrere Datenquellen aus.
- Wählen Sie die Schaltfläche Aktion aus.
- Wählen Sie Extrakt aus. Wenn die Funktion "Extrahieren der Verschlüsselung im Ruhezustand" auf der Site aktiviert ist, wählen Sie entweder Verschlüsselt oder Unverschlüsseltaus.
Einschränkungen
- Ihre Anmeldeinformationen für die Verbindung müssen in die Datenquelle eingebettet sein.
- Sie können keine Extrakte für eingebettete Datenquellen erstellen, die auf veröffentlichte Datenquellen verweisen. Erstellen Sie den Extrakt als Problemumgehung direkt in der veröffentlichten Datenquelle.
- Für dateibasierte Datenquellen können keine Extrakte erstellt werden. Dateibasierte Datenquellen verfügen bereits über spezielle Leistungsmerkmale, und das Hinzufügen der Extraktion hat keinen Leistungsvorteil.
- Diese Funktion gilt nicht für auf Bridge basierende Datenquellen in Tableau Cloud.
Aktuellhalten von extrahierten Daten
Nach dem Extrahieren von Daten können Sie optional einen Zeitplan für die Extraktaktualisierung einrichten, um die Daten aktuell zu halten. Weitere Informationen finden Sie unter Aktualisieren von Daten gemäß Zeitplan.
Überwachen und Verwalten von Extrakten
Serveradministratoren können die Extrakterstellung in der Administratoransicht Hintergrundaufgaben für Extrakte überwachen. Weitere Informationen finden Sie unter Hintergrundaufgaben für Extrakte.
Serveradministratoren können Extrakte auf der Seite "Aufträge" verwalten. Weitere Informationen finden Sie unter Verwalten von Hintergrundaufträgen in Tableau Server.
Für Extrakterstellungsaufträge sowie Extraktaktualisierungsaufträge gilt ein maximales Abfragelimit, bevor ein Timeout erfolgt. Dadurch wird verhindert, dass Aufträge für immer ausgeführt werden und eine uneingeschränkte Menge an Serverressourcen verwendet wird. Das Timeout zur Beschränkung von Extraktabfragen kann von Serveradministratoren mithilfe der Konfigurationseinstellung für die TSM-Befehlszeilenschnittstelle backgrounder.querylimit
konfiguriert werden. Weitere Informationen finden Sie unter tsm configuration set-Optionen.
Serveradministratoren können die Webdokumenterstellung verwalten. Für weitere Informationen, siehe Festlegen des Zugriffs/der Funktionen für die Webdokumenterstellung einer Site.