Aktualisieren von Extrakten

Wenn die Originaldaten geändert wurden, können Sie den Extrakt per Tableau Desktop aktualisieren, indem Sie im Menü Daten eine Datenquelle auswählen und dann auf Extrakt > Aktualisieren klicken. Extrakte können auf zwei Arten eingerichtet werden: vollständig aktualisiert oder inkrementell aktualisiert.

Bei einer vollständigen Aktualisierung werden sämtliche Daten in dem Extrakt durch die neuesten Informationen aus der ursprünglichen Datenquelle ersetzt. Bei einer inkrementellen Aktualisierung gibt es zwei Varianten: Sie können nur die Zeilen hinzufügen lassen, die seit der letzten Aktualisierung neu hinzugekommen sind, oder Sie können einen zeitlichen Teilbereich ab dem Aktualisierungsdatum definieren, aus dem die Zeilen aktualisiert werden sollen. Der optionale zweite Ansatz ist für Fälle gedacht, in denen der Extrakt aktualisiert werden soll, falls die Möglichkeit besteht, dass sich bereits extrahierte Daten in der Datenquelle möglicherweise geändert haben. Weitere Informationen über die Vorgehensweise zum Extrahieren von Daten finden Sie auf der Seite Extrahieren von Daten.

Hinweis: Sie können Extraktaktualisierungen mithilfe des Befehlszeilenprogramm für die Tableau-Datenextraktion auch automatisieren.

Vor der Aktualisierung von Extrakten

Wenn Sie einen Extrakt aktualisieren möchten, notieren Sie sich das Dateiformat des Extrakts, bevor Sie die Aufgabe ausführen. Wenn Sie eine Aktualisierung an einem .tde-Extrakt unter Verwendung der Version 2022.4 oder neuer vornehmen, wird für den Extrakt automatisch ein Upgrade auf einen .hyper-Extrakt durchgeführt. Ein Upgrade auf einen .hyper-Extrakt bietet zwar viele Vorteile, es wird Ihnen jedoch dann nicht mehr möglich sein, den Extrakt mit einer früheren Version von Tableau Desktop zu öffnen. Weitere Informationen finden Sie unter Extrahieren des Upgrades in das .hyper-Format.

Hinweis: TDE-Dateien werden nach Version 2024.2 von Tableau in keiner Form mehr unterstützt und müssen auf das .hyper-Format aktualisiert werden, um verwendet werden zu können.

Konfigurieren einer vollständigen Extraktaktualisierung

Standardmäßig sind Extrakte so konfiguriert, dass sie vollständig aktualisiert werden. Das bedeutet, dass bei jeder Aktualisierung des Extraktes alle Zeilen durch die Daten aus der Originaldatenquelle ersetzt werden. Durch diese Aktualisierung wird sichergestellt, dass Sie eine genaue Kopie des Inhalts der Originaldatenquelle erhalten. Allerdings kann diese Aktualisierung abhängig von der Größe des Extraktes unter Umständen viel Zeit und Datenbankressourcen in Anspruch nehmen. Wenn ein Extrakt nicht für eine inkrementelle Aktualisierung konfiguriert ist, wird der Extrakt durch die Auswahl, ihn zu aktualisieren, vollständig aktualisiert.

Veröffentlichen in Tableau Server

Falls Sie den Extrakt als Datenquelle in Tableau Server oder Tableau Online veröffentlichen möchten, können Sie einen Zeitplan für die Extraktaktualisierung während der Veröffentlichung angeben.

Ein Dialogfeld zum Planen einer Datenaktualisierung.

Wenn Sie den Extrakt in einer Arbeitsmappe in Tableau Server veröffentlichen möchten, können Sie ebenso einen Zeitplan für die Extraktaktualisierung während der Veröffentlichung angeben. Weitere Informationen finden Sie unter Planen von Extraktaktualisierungen beim Veröffentlichen einer Arbeitsmappe.

Veröffentlichen in Tableau Cloud

Wenn Sie den Extrakt als Datenquelle in Tableau Cloud veröffentlichen möchten, sind Ihre Optionen zum Aktualisieren der Daten von den Eigenschaften Ihrer Datenquellen abhängig. Weitere Informationen zum Aktualisieren von Daten aus bestimmten Datenquellen finden Sie unter Extraktaktualisierungsoptionen nach Datenquelle.

Konfigurieren einer inkrementellen Extraktaktualisierung

Die meisten Datenquellen unterstützen inkrementelle Aktualisierungen. Anstatt den gesamten Extrakt zu aktualisieren, können Sie die Aktualisierung so konfigurieren, dass nur die Zeilen hinzugefügt werden, die seit der letzten Datenextraktion neu hinzugekommen sind.

Beispiel: Sie haben eine Datenquelle, die täglich mit neuen Verkaufstransaktionen aktualisiert wird. Anstatt jeden Tag den gesamten Extrakt neu zu erstellen, reicht es, die an diesem Tag neu hinzugekommenen Transaktionen hinzuzufügen. Sie können dann beispielsweise einmal pro Woche eine vollständige Aktualisierung durchführen, um sicherzugehen, dass Sie über die aktuellsten Daten verfügen.

Sie können in den Einstellungen für „Inkrementell“ optional auch einen zeitlichen Teilbereich definieren, in dem alle zugehörigen Daten aus dem vorhandenen Auszug entfernt und vollständig aktualisiert werden, wobei alle seit der letzten Aktualisierung erfolgten Änderungen oder Ergänzungen in diesem Zeitraum erfasst werden.

Nicht eindeutige Spalte

Mit Version 2024.1 führt Tableau eine Funktion ein, die es Benutzern ermöglicht, inkrementelle Aktualisierungen von Extrakten mithilfe einer nicht eindeutigen Schlüsselspalte durchzuführen. Dieses Update führt einen zusätzlichen Schritt in den Prozess ein.

Teilbereichsaktualisierung für inkrementelle Extrakte

Ab Tableau 2024.2 können Sie einen zusätzlichen Zeitraum angeben, aus dem zuvor extrahierte Daten erneut extrahiert werden sollen, sodass möglicherweise erfolgte Änderungen erfasst werden. Dies geschieht mit den Feldern Minimaler zu aktualisierender Datumsbereich. Dies ist nützlich, wenn beispielsweise die Datenquelle Einfügungen und nachträgliche Änderungen innerhalb eines definierten Zeitraums zulässt. Nachdem konfiguriert, wird der inkrementelle Extrakt alle neuen Daten sowie die zuvor bereits extrahierten Daten aus einem festgelegten Zeitraum abrufen.

Nachdem Sie eine Zahl (z. B. 2) und einen Zeitraum (z. B. „Monat“) ausgewählt haben, wird der folgende Hilfetext gemäß Ihrer Auswahl aktualisiert („Daten der letzten 2 Monate ab dem Aktualisierungsdatum werden immer aktualisiert.“). Wenn kein Zeitraum eingegeben wird, werden nur Inhalte abgerufen, die neuer als die im vorhandenen Auszug enthaltenen sind.

Grundlegendes zu Teilbereichsaktualisierungen

Die für Sie optimale Konfiguration von Teilbereichsaktualisierungen hängt davon ab, wie häufig Sie Ihre Extrakte aktualisieren möchten, wie häufig Ihre Datenquelle aktualisiert wird und was für ein Volumen an Daten normalerweise in jedem Zeitraum aktualisiert wird. Es ist wichtig zu verstehen, wie Tableau Ihre Auswahl der Extraktkonfigurationsoptionen interpretiert, um sicherzustellen, dass der Extrakt die erwarteten Daten enthält.

  • Wenn eine Anzahl von Zeiteinheiten eingegeben wird, interpretiert Tableau dies so, als sollen alle Daten aus der vorhandenen Zeiteinheit plus den Daten aus zusätzlichen X Einheiten abgerufen werden. Beispiel: Wenn Sie 3 Monate festlegen, werden alle Daten des aktuellen Monats plus den Daten der vorherigen 3 Monate abgerufen. Wäre das aktuelle Datum nun der 1. April, würden alle Daten aus dem April (in diesem Fall 1 Tag) plus alle Daten aus dem Januar, Februar und März – also Daten aus ungefähr 91 Tagen – abgerufen. Wenn Sie die gleiche Aktualisierung am 28. April ausführen, werden Daten aus 28 Tagen des Aprils plus Daten der vorangegangenen 3 Monate – also Daten aus ungefähr 118 Tagen – abgerufen.
  • Für eine möglichst detaillierte Kontrolle und Konsistenz empfiehlt es sich, die kleinste anwendbare Zeiteinheit (z. B. einen Tag) zu verwenden, die für Ihre Daten einen Sinn ergibt. Wenn immer die Daten der letzten 90 Tage plus dem Aktualisierungstag aktualisiert werden sollen, wählen Sie „90“ als Zahl und „Tag“ als Zeitraum aus.
  • Tableau empfiehlt, Ihren Extrakt auf der Grundlage eines Datums-/Uhrzeitfelds zu erstellen, das das Datum und die Uhrzeit widerspiegelt, zu dem ein Datensatz eingegeben wurde. Wenn das zum Bestimmen von Extrakten verwendete Datumsfeld Zeitangaben enthält, die sich auf die Zukunft beziehen (z. B. „Geplantes Lieferdatum der Bestellung“), entsprechen die Ergebnisse bei Verwendung der Funktion zur Teilbereichsaktualisierung möglicherweise nicht Ihren Erwartungen. Beispiel: Eine inkrementelle Aktualisierung ist so eingerichtet, dass sie die Daten der letzten zwei Monate ab dem Aktualisierungsdatum extrahiert. Nun ist der 1. April, aber es gibt in der Datenbank Datensätze, bei denen dieses Datumsfeld Werte enthält, die bis zu 6 Monate in der Zukunft – also bis zum 1. September – reichen. Wenn die Aktualisierung in diesem Beispiel erfolgt, werden nur die Daten aus dem April (dem aktuellen Aktualisierungsmonat) und die Daten der vorherigen 2 Monate extrahiert. Wenn in der Datenquelle Änderungen an Zeilen stattgefunden haben, die mit zukünftigen Zeitpunkten nach dem April verknüpft sind, werden sie nicht aktualisiert.
  • Wenn in der Datenquelle mehr neue Daten zum Aktualisieren vorhanden sind als der konfigurierte Zeitraum, wird mit dem Abrufen der zusätzlichen Daten an dem Punkt begonnen, an dem neue Daten verfügbar sind. Wenn Sie den Teilbereich beispielsweise für nur die letzten 2 Tage konfigurieren, die letzte Aktualisierung jedoch vor 10 Tagen erfolgte, werden alle neuen Daten der 10 Tage plus die bereits extrahierten Daten der letzten 2 Tage extrahiert.

Hinweis: Wenn sich die Datenstruktur der Quelldaten ändert (z. B. eine neue Spalte hinzugefügt wird), müssen Sie eine vollständige Extraktaktualisierung vornehmen, bevor Sie erneut mit inkrementellen Aktualisierungen beginnen können.

Gehen Sie wie folgt vor, um einen Extrakt einzurichten, der inkrementell aktualisiert werden soll, oder stellen Sie einen vorhandenen vollständigen Extrakt auf inkrementelle Aktualisierung um.

  1. Wählen Sie im Menü Daten eine Datenquelle aus und klicken Sie dann auf Daten extrahieren.

  2. Wählen Sie im Dialogfeld "Daten extrahieren" als Anzahl der zu extrahierenden Zeilen All rows (Alle Zeilen) aus. Die inkrementelle Aktualisierung kann nur festgelegt werden, wenn alle Zeilen aus der Datenbank extrahiert werden.

    Hinweis: Ein Stichprobenextrakt kann nicht inkrementiert werden.

  3. Erweitern Sie den Abschnitt Inkrementelle Aktualisierung, und aktualisieren Sie Inkrementelle Aktualisierung.

  4. Hinweis: Die Option „Inkrementelle Aktualisierung“ ist nicht verfügbar, wenn Sie „Aggregation“ aktivieren.

  5. Geben Sie eine Spalte in der Datenbank an, die verwendet werden soll, um neue Zeilen zu identifizieren.

    So können Sie zum Beispiel ein Datumsfeld oder eine ID-Spalte auswählen, deren Wert jedes Mal erhöht wird, wenn Zeilen zur Datenbank zugefügt werden.

  6. (Optional) Wenn Sie in Tableau eine Datums- oder Datumszeitspalte auswählen, können Sie eine teilweise Aktualisierung der extrahierten Daten durchführen, indem Sie einen bestimmten Datumsbereich angeben. Bestimmen Sie die Anzahl der Tage und geben Sie die Skala für Datum/Uhrzeit an, um den minimalen Datumsbereich für die Aktualisierung festzulegen (z. B. 14 Tage ab dem Aktualisierungsdatum).

  7. (Optional) Wenn kein minimaler Aktualisierungsbereich festgelegt ist, erweitern Sie Erweiterte Einstellungen, um festzulegen, wie neue Zeilen abgerufen werden. Sie können entweder die zuletzt hinzugefügten Zeilen ersetzen lassen, indem Werte aktualisiert werden, die gleich oder größer als der zuletzt aufgezeichnete Wert sind, oder die zuletzt hinzugefügten Zeilen beibehalten lassen, indem der Extrakt nur mit Werten aktualisiert wird, die größer als der zuletzt aufgezeichnete Wert sind.

  8. Hinweis: Wenn Filter hinzugefügt werden, werden die erweiterten Einstellungen für „Inkrementelle Aktualisierung“ ausgegraut angezeigt und die Standardeinstellung „Zuletzt hinzugefügte Zeilen nicht ersetzen“ wird erzwungen. Damit sollen eventuelle Konflikte zwischen bestimmten Filterkriterien und der erweiterten inkrementellen Aktualisierungslogik vermieden werden, die „Die zuletzt hinzugefügten Zeilen ersetzen“ würde.

  9. Wählen Sie zum Abschluss Einstellungen speichern aus.

Überlegungen zum Aktualisieren von Extrakten

Bearbeiten eines Extrakts

Wenn Sie einen bestehenden Extrakt bearbeiten, wird die letzte Aktualisierung angezeigt, damit Sie sichergehen können, dass Sie den Extrakt mit den richtigen Daten aktualisieren.

Vollständige Aktualisierung

Bei einer vollständigen Aktualisierung werden bei jeder Aktualisierung des Extrakts alle Zeilen durch die Daten in der ursprünglichen Datenquelle ersetzt. Eine vollständige Aktualisierung kann länger dauern und die Datenbank stärker auslasten.

Uhrzeit/Datum-Genauigkeit und Extrakte

Die Daten-Engine (d. h. der zugrunde liegende Mechanismus, den Tableau nutzt, um Extrakte zu erstellen) speichert Zeitwerte mit einer Präzision von bis zu 3 Dezimalstellen. Wenn Sie für Neue Zeilen über Spalte identifizieren eine Spalte vom Typ „Datum/Uhrzeit“ oder „Zeitstempel“ angeben und in der Datenbank eine höhere Genauigkeit als in Tableau verwendet wird, kann das dazu führen, dass Zeilen nach einer inkrementellen Aktualisierung doppelt vorhanden sind. Beispiel: Die Datenbank enthält eine Zeile mit dem DatumZeit-Wert 2015-03-13 17:30:56.502352 und eine Zeile mit dem DatumZeit-Wert 2015-03-13 17:30:56.502852. In Tableau werden beide Zeilen mit dem DatumZeit-Wert 2015-03-13 17:30:56.502 gespeichert, wodurch doppelte Zeilen entstehen.

Anzeigen des Extraktverlaufs (Tableau Desktop)

Sie können einen Verlauf der Extraktaktualisierung anzeigen, indem Sie eine Datenquelle im Menü Daten und anschließend Extrakt > Verlauf auswählen.

Im Dialogfeld "Extraktverlauf" werden zu jeder Aktualisierung Angaben zu Datum und Uhrzeit, dazu, ob es sich um eine vollständige oder eine inkrementelle Aktualisierung gehandelt hat, und zu der Anzahl der hinzugefügten Zeilen angezeigt. Wenn die Aktualisierung über eine Datei durchgeführt wurde, wird auch der Name der Quelldatei angezeigt.

Extraktverlaufstabelle mit Optionen zum Löschen des Verlaufs oder zum Schließen der Tabelle.