Tableau Catalog aktivieren

Tableau Catalog entdeckt und indiziert alle Inhalte auf Ihrer Tableau Online-Site oder Ihrem Tableau Server, einschließlich Arbeitsmappen, Datenquellen, Blätter und Schemata. Die Indexierung wird verwendet, um Informationen über den Inhalt oder die Metadaten, über das Schema und die Herkunft des Inhalts zu sammeln. Anhand der Metadaten identifiziert Catalog dann alle Datenbanken, Dateien und Tabellen, die von den Inhalten auf Ihrer Tableau Online-Site oder Ihrem Tableau Server verwendet werden.

Catalog ist verfügbar mit dem Datenmanagement-Add-on. Für weitere Informationen, siehe Benutzen des Data Management Add-ons.

Zusätzlich zu Catalog können die Metadaten Ihrer Inhalte auch über die Tableau-Metadaten-API bzw. die REST API vpn Tableau Server mithilfe von Metadatenmethoden abgerufen werden.

Catalog in Tableau Online

Catalog wird automatisch eingeschaltet, wenn Tableau Online mit dem Datenmanagement-Add-on lizenziert wird.

Nachdem Ihre Tableau Online-Website mit der Datenmanagement-Add-on lizenziert wurde, werden die Inhalte, die bereits auf Ihrer Tableau Online-Website vorhanden sind, sofort indiziert. Die Zeit, die benötigt wird, um den Inhalt zu indizieren, hängt von der Menge der vorhandenen Inhalte ab. Nachdem der Inhalt anfänglich indiziert wurde, überwacht Catalog neu veröffentlichte Inhalte und andere Änderungen an Assets und indiziert weiterhin im Hintergrund.

Catalog in Tableau Server

Als Tableau Server-Administrator müssen Sie auf einige vor und während der Aktivierung von Catalog zu berücksichtigende Dinge achten, um eine optimale Leistung von Catalog in Ihrer Tableau Server-Umgebung sicherzustellen.

Vor der Aktivierung von Catalog

Wenn Catalog zum ersten Mal aktiviert wird, werden die bereits in Ihrer Tableau Server-Umgebung vorhandenen Inhalte sofort indiziert. Catalog verwendet den nicht interaktiven Microservice-Container, um sämtliche Inhalte auf Tableau Server zu indizieren. Der Indizierungsprozess besteht aus zwei wesentlichen Teilen: der erstmaligen Aufnahme und der Ereignisüberwachung.

Die Zeit, die Catalog benötigt, um den Inhalt zu indizieren, hängt von einigen Faktoren ab:

  • Menge der Inhalte auf Tableau Server: Die Menge der Inhalte wird anhand der Gesamtzahl der Arbeitsmappen, veröffentlichten Datenquellen und Schemas gemessen, die in Tableau Server veröffentlicht wurden.
  • Ressourcen, die dem nicht interaktiven Container zur Verfügung stehen: Insbesondere die Anzahl der Threads, Prozesse und Speicherkapazität, die zur Unterstützung des nicht interaktiven Microservice-Containers verfügbar sind. Weitere Informationen zum nicht interaktiven Microservice-Container finden Sie im Thema Tableau Server Microservice-Container.

Nachdem Sie die Faktoren verstanden haben, die sich auf die Aufnahme in Catalog auswirken, müssen Sie möglicherweise einige Anpassungen vornehmen, bevor Sie Catalog aktivieren. Die empfohlenen Prozesse und Anpassungen zur Unterstützung der Aktivierung von Catalog werden im Folgenden beschrieben.

Schritt 1: Bestimmen der Menge an Inhalten auf Tableau Server

Gehen Sie wie folgt vor, um die Menge an Inhalten auf Tableau Server zu bestimmen:

  1. Melden Sie sich mit Ihren Admin-Anmeldeinformationen bei Tableau Server an.
  2. Wechseln Sie zur Seite Erkunden.
  3. Klicken Sie auf das Dropdown-Menü "Projekte auf oberster Ebene" und zählen Sie die Zahlen neben Alle Arbeitsmappen, Alle Datenquellen und Alle Schemas zusammen. Dies ist die Gesamtmenge an Inhalten auf Tableau Server.

Schritt 2: Einschätzen, wie lange die Aufnahme dauern wird

Um die Zeit einzuschätzen, die Catalog für die Erstaufnahme von Inhalten in Tableau Server benötigt, vergleichen Sie Ihr Tableau Server-Setup mit einem Basis-Setup von Tableau Server.

Für einen Tableau Server mit folgenden Setup-Parametern kann die erstmalige Aufnahme etwa 6 Stunden in Anspruch nehmen.

Komponenten Basiswerte
Inhalt 12.000 Arbeitsmappen, veröffentlichte Datenquellen und Schemas
Threads

2

JVM-Heap-Größe (Speicher) 64 MB (mindestens) – 4 GB (maximal)
Aufnahme ~6 Stunden

Wenn Sie ungefähr die Hälfte des Inhalts in Ihrer Tableau Server-Umgebung haben, kann die erstmalige Aufnahme etwa die Hälfte der Zeit in Anspruch nehmen.

Beispiel: 6.000 (Arbeitsmappen, veröffentlichte Datenquellen und Schemas) + 2 (Threads) = ~3 Stunden (Aufnahme)

Wenn Sie ungefähr doppelt so viele Inhalte in Ihrer Tableau Server-Umgebung haben, kann die anfängliche Aufnahme etwa doppelt so lange dauern.

Zum Beispiel: 24.000 (Arbeitsmappen, veröffentlichte Datenquellen und Schemas) + 2 (Threads) = ~12 Stunden (Aufnahme)

Schritt 3 (optional): Verringern der Aufnahmedauer und erhöhen der Arbeitsspeicherkapazität

Wenn Sie die Geschwindigkeit der erstmaligen Erfassung erhöhen und damit die Dauer der erstmaligen Aufnahme verringern möchten, können Sie die Anzahl der Threads erhöhen, die dem nicht interaktiven Microservice-Container zugewiesen sind. Wenn Sie die Anzahl der Threads erhöhen, muss auch die Arbeitsspeicherkapazität erhöht werden.

Threads

In der Regel hängt die Zeit, die Catalog für die erstmalige Aufnahme benötigt, mit der Anzahl der zugewiesenen Threads zusammen. Wenn Sie also die geschätzte Aufnahmedauer um die Hälfte reduzieren möchten, verdoppeln Sie die zugewiesenen Threads.

Wenn Sie die Anzahl der Threads erhöhen möchten, verwenden Sie den Befehl tsm configuration set – k graphletingestor.providerEventIngestorClient.connectionPool.maxConnectionPerInstance Weitere Informationen finden Sie in den Themen tsm-Konfiguration und tsm configuration set-Optionen.

Arbeitsspeicher

Wenn Sie die Anzahl der Threads erhöhen, die für die Aufnahme zugewiesen sind, sollten Sie auch die JVM-Heap-Größe (Speicher) erhöhen, um die mit Catalog verknüpften Dienste zu unterstützen. Tableau empfiehlt, nicht mehr als 2 GB Arbeitsspeicher pro hinzugefügter zusätzlicher Threadanzahl hinzuzufügen.

Wenn Sie den Arbeitsspeicher erhöhen möchten, verwenden Sie den Befehl tsm configuration set -k noninteractive.vmopts Weitere Informationen finden Sie in den Themen tsm-Konfiguration und tsm configuration set-Optionen.

Wichtig: Bevor Sie die Thread-Anzahl und den Arbeitsspeicher erhöhen, sollten Sie Folgendes beachten:

  • Die oben genannten Empfehlungen beziehen sich auf die Gesamtanzahl der Threads für alle Knoten, nicht pro Knoten oder pro Instanz des nicht interaktiven Containers.
  • Tableau empfiehlt, die Threadanzahl schrittweise um nur 2 Threads gleichzeitig zu erhöhen, um Probleme mit der CPU-Auslastung des Tableau Server-Repositorys (PostgreSQL-Datenbank) zu vermeiden und gleichzeitig Ihre Tableau Server-Umgebung genau zu überwachen.
  • Beachten Sie, dass die CPU-Auslastung der PostgreSQL-Datenbank sprunghaft ansteigen und zu einem Failover führen kann, wenn zu viele Threads für die Erstaufnahme zugewiesen werden. Zu den zu beachtenden Symptomen gehören SQLException-Fehler in den vizportal-Protokollen. Weitere Informationen finden Sie im Thema Repository-Failover.

Schritt 4: Aktivieren von Datenmanagement-Add-on

Wenn noch nicht geschehen, können Sie nach den erforderlichen Anpassungen zur optimalen Catalog-Aufnahme die Datenmanagement-Add-on aktivieren. Weitere Informationen finden Sie unter Das Data Management Add-on lizenzieren.

Schritt 5 (optional): Catalog-Funktionen deaktivieren

Im Rahmen der Aktivierung von Datenmanagement-Add-on sind die Catalog-Funktionen standardmäßig aktiviert. Aufgrund des Indizierungsprozesses und der geschätzten Zeit, die zum Abschließen benötigt wird, können Sie den Katalog vorübergehend deaktivieren, damit Tableau Server-Benutzer erst dann auf Catalog-Funktionen zugreifen können, wenn sie bereit sind und vollständige und genaue Ergebnisse liefern können.

Um Catalog zu deaktivieren, gehen Sie wie nachfolgend beschrieben vor.

  1. Melden Sie sich mit Ihren Tableau Server-Admin-Anmeldeinformationen bei Tableau Server an.
  2. Klicken Sie im linken Navigationsbereich auf Einstellungen.
  3. Deaktivieren Sie auf der Registerkarte Allgemein unter Tableau Catalog das Kontrollkästchen Tableau Catalog aktivieren.

Aktivieren von Catalog

Um Catalog in Tableau Server zu aktivieren, gehen Sie wie unten beschrieben vor.

Schritt 1: Ausführen des Befehls "tsm Wartung Metadaten-Dienste aktivieren"

Verwenden Sie den Befehl tsm maintenance metadata-services enable, um die Tableau-Metadaten-API zu deaktivieren. Nachdem die Metadaten-API aktiviert wurde, wird Catalog automatisch eingeschaltet, wenn der Tableau Server mit Datenmanagement-Add-on lizenziert wird. Weitere Informationen zur Ausführung des Befehls tsm finden Sie unter tsm maintenance.

  1. Öffnen Sie auf dem Ausgangsknoten (dem Knoten, auf dem TSM installiert ist) als Admin eine Eingabeaufforderung im Cluster.
  2. Führen Sie den folgenden Befehl aus: tsm maintenance metadata-services enable

Hinweise: Wenn Sie diesen Befehl ausführen, beachten Sie bitte folgende Punkte:

  • Dieser Befehl stoppt und startet einige von Tableau Server verwendete Dienste, wodurch bestimmte Funktionen, z. B. die Funktion "Empfehlungen", für Ihre Benutzer vorübergehend nicht verfügbar sind.
  • Zu diesem Zeitpunkt wird ein neuer Metadatenindex erstellt. Wenn Sie diesen Befehl zu späteren Zeitpunkten ausführen, wird ein neuer Index erstellt, der den vorhandenen ersetzt.

Schritt 2: Überwachen des Aufnahmefortschritts

Um sicherzustellen, dass der erstmalige Aufnahmeprozess reibungslos verläuft, empfiehlt Tableau, den Fortschritt über Tableau Server mithilfe der folgenden Verfahren zu überwachen. Mit den folgenden Verfahren können Sie den Status der Erstaufnahme nach Inhaltstyp abrufen.

Schritt 1: Abrufen der Portnummer des nicht interaktiven Microservice-Containers

  1. Öffnen Sie auf dem Ausgangsknoten (dem Knoten, auf dem TSM installiert ist) als Admin eine Eingabeaufforderung im Cluster.
  2. Führen Sie den folgenden Befehl aus, um die Portnummer für den nicht interaktiven Microservice-Container abzurufen: tsm topology list-ports
  3. Suchen Sie in den Ergebnissen nach noninteractive:primary und notieren Sie sich die Portnummer in der letzten Spalte. Die Portnummer wird in Schritt 3 unten verwendet.

Schritt 2: Abrufen von Authentifizierungscookies vom Browser

  1. Öffnen Sie einen Browser, beispielsweise Google Chrome, und melden Sie sich mit Ihren Tableau Server-Administratoranmeldeinformationen bei Tableau Server an.
  2. Gehen Sie mit der Option "Entwicklertools" (oder ähnlichem) in den Abschnitt "Cookies" und notieren Sie sich die Werte für die folgenden Cookies: XSFF-TOKEN und workgroup_session_id.

    Schließen Sie das Browserfenster nicht.

Schritt 3: Abrufen des Aufnahmestatus

Gehen Sie mit demselben Browserfenster in Schritt 2 oben wie folgt vor:

  • Kopieren Sie den URI oben und fügen Sie ihn in die Adressleiste des Browsers ein.
  • Ersetzen Sie <your-server> durch Ihren Tableau Server-Computernamen
  • Ersetzen Sie <port> durch die Portnummer, die Sie am Ende von Schritt 1 oben notiert haben.

http://<your-server>:<port>/relationship-service-war/control/backfill/status

Beispiel: http://10.100.00.0.00:8850/relationship-service-war/control/backfill/status.

Hinweis: Alternativ können Sie den Aufnahmestatus mithilfe von Postman abrufen, indem Sie eine http GET-Abfrage mithilfe des oben genannten URI und der folgenden erforderlichen Schlüssel im Anforderungsheader erstellen:

Schlüssel Wert
Cookie XSRF-TOKEN=<cookie-value>; workgroup_session_id=<cookie-value>
Inhaltstyp application/json

Schritt 4: Überprüfen der Ergebnisse

Der Endpunkt aus Schritt 3 oben gibt ein SON-Blob zurück, das den Aufnahmestatus nach Inhalt und Asset-Typ abgrenzt. Beachten Sie bei der Überprüfung der Ergebnisse Folgendes:

  • Wenn der Status backfillComplete true anzeigt, deutet das darauf hin, dass die anfängliche Aufnahme abgeschlossen ist
  • Wenn der Status backfillComplete false anzeigt, deutet das darauf hin, dass die anfängliche Aufnahme abgeschlossen ist

Beispiel:

[
{"type":"PublishedDatasource","currentId":{"contentId":null,"pageToken":null},"processedCount":0,"durationSeconds":0,"backfillComplete":true},
{"type":"Database","currentId":{"contentId":null,"pageToken":null},"processedCount":0,"durationSeconds":0,"backfillComplete":true},
{"type":"DatabaseTable","currentId":{"contentId":null,"pageToken":null},"processedCount":0,"durationSeconds":0,"backfillComplete":true},
{"type":"Workbook","currentId":{"contentId":null,"pageToken":null},"processedCount":0,"durationSeconds":0,"backfillComplete":true},
{"type":"Flow","currentId":{"contentId":null,"pageToken":null},"processedCount":0,"durationSeconds":0,"backfillComplete":true}
]

Schritt 3: Konfigurieren des SMTP-Setups

Wenn nicht bereits für Tableau Server eingerichtet, konfigurieren Sie das SMTP-Setup. SMTP unterstützt das Senden von E-Mails an Besitzer, die bei Datenänderungen kontaktiert werden müssen. Weitere Informationen zur Konfiguration von SMTP finden Sie unter Konfigurieren des SMTP-Setups.

Schritt 4 (optional): Catalog-Funktionen aktivieren

Wenn Sie die Katalogfunktionen deaktiviert haben, bevor Sie Catalog in einem der oben genannten Verfahren aktivieren, müssen Sie Catalog aktivieren, um die Funktionen für die Benutzer zugänglich zu machen.

Um Catalog zu aktivieren, gehen Sie wie nachfolgend beschrieben vor.

  1. Melden Sie sich mit Ihren Tableau Server-Admin-Anmeldeinformationen bei Tableau Server an.
  2. Klicken Sie im linken Navigationsbereich auf Einstellungen.
  3. Deaktivieren Sie auf der Registerkarte Allgemein unter Tableau Catalog das Kontrollkästchen Tableau Catalog aktivieren.

Fehlerbehebung bei Catalog oder der Metadaten-API

Nachrichten zu Zeitüberschreitungen und Überschreitungen der Knotenobergrenze

Um sicherzustellen, dass Catalog-Aufgaben oder Metadaten-API-Abfragen, die eine große Anzahl von Ergebnissen zurückgeben müssen, nicht alle Tableau Server-Systemressourcen in Anspruch nehmen, implementiert Catalog sowohl Obergrenzen für die Zeitüberschreitung als auch für Knoten.

Zeitüberschreitungsobergrenze

Wenn Aufgaben in Catalog oder Abfragen in der Metadaten-API die Zeitüberschreibungsobergrenze erreichen, wird für Sie und Ihre Benutzer die folgende Meldung angezeigt:

"Teilergebnisse werden angezeigt, Anforderungszeitobergrenze überschritten. Versuchen Sie es später erneut." oder TIME_LIMIT_EXCEEDED

Um dieses Problem zu beheben, können Sie als Tableau Server-Administrator die Zeitüberschreitungsobergrenze mit dem Befehl tsm configuration set –k metadata.query.limits.time erhöhen. Weitere Informationen finden Sie in den Themen tsm-Konfiguration und tsm configuration set-Optionen.

Wichtig: Durch die Erhöhung der Zeitüberschreitungsobergrenze kann die CPU länger stärker belastet werden, was die Leistung anderer Prozesse auf Tableau Server beeinträchtigen kann.

Knotenobergrenze

Wenn Aufgaben in Catalog oder Abfragen in der Metadaten-API die Knotenobergrenze erreichen, wird für Sie und Ihre Benutzer die folgende Meldung angezeigt:

NODE_LIMIT_EXCEEDED

Um dieses Problem zu beheben, können Sie als Tableau Server-Administrator die Knotenobergrenze mit dem Befehl tsm configuration set –k metadata.query.limits.count erhöhen. Weitere Informationen finden Sie in den Themen tsm-Konfiguration und tsm configuration set-Optionen.

Wichtig: Die Erhöhung der Zeitüberschreitungsobergrenze kann sich auf den Systemspeicher auswirken.

Indizierungsleistung

Wenn es länger als erwartet dauert, bis Catalog den Inhalt auf Tableau Server indiziert, sollten Sie die Anzahl der Threads erhöhen, die dem nicht interaktiven Microservice-Container zugewiesen sind. Sie können die Metadaten-API vorübergehend deaktivieren, indem Sie den Befehl tsm maintenance metadata-services disable ausführen und dann den im Abschnitt oben unter Tableau Catalog aktivieren beschriebenen Schritten folgen.

Catalog wird automatisch eingeschaltet, wenn Tableau Online mit Datenmanagement-Add-on lizenziert wird.

Nachdem Ihre Tableau Online-Website mit der Datenmanagement-Add-on lizenziert wurde, werden die Inhalte, die bereits auf Ihrer Tableau Online-Website vorhanden sind, sofort indiziert. Die Zeit, die benötigt wird, um den Inhalt zu indizieren, hängt von der Menge der vorhandenen Inhalte ab. Nachdem der Inhalt anfänglich indiziert wurde, überwacht Catalog neu veröffentlichte Inhalte und andere Änderungen an Assets und indiziert weiterhin im Hintergrund.

Tableau Catalog deaktivieren

Als Administrator des Tableau Servers oder der Tableau Online-Site können Sie Catalog jederzeit deaktivieren. Wenn Catalog deaktiviert ist, sind die Funktionen von Catalog, wie etwa das Hinzufügen von Warnungen zur Datenqualität oder die Möglichkeit, Berechtigungen für Datenbank- und Tabellen-Assets explizit zu verwalten, nicht über Tableau Online oder Tableau Server selbst zugänglich. Catalog indiziert jedoch weiterhin veröffentlichte Inhalte, und die Metadaten sind über die Tableau-Metadaten-API und Metadatenmethoden in der Tableau Server REST-API zugänglich.

  1. Melden Sie sich bei Tableau Online als Site-Administrator oder bei Tableau Server als Server-Administrator an.

  2. Klicken Sie im Navigationsbereich auf Einstellungen.

  3. Deaktivieren Sie auf der Registerkarte Allgemein unter Tableau Catalog das Kontrollkästchen Tableau Catalog aktivieren.

Beenden der Indizierung von Metadaten in Tableau Server

Um als Administrator von Tableau Server die Indizierung der veröffentlichten Inhalte in Tableau Server zu stoppen, deaktivieren Sie die Tableau-Metadaten-API. Um die Metadaten-API zu deaktivieren, führen Sie den Befehl tsm maintenance metadata-services disable aus. Für weitere Informationen, siehe tsm-Wartung.

Anmerkung: Die Indexierung kann für eine Tableau Online-Site nicht gestoppt werden.

Vielen Dank für Ihr Feedback! Es gab einen Fehler bei der Übermittlung Ihres Feedback. Versuchen Sie es erneut oder senden Sie uns eine Nachricht.