Abilitare Tableau Catalog

Tableau Catalog(Link opens in a new window) individua e indicizza tutti i contenuti del sito Tableau Online o di Tableau Server, tra cui cartelle di lavoro, origini dati, fogli e flussi. L'indicizzazione è usata per raccogliere informazioni sul contenuto, o metadati, sullo schema e sulla derivazione del contenuto. Quindi, dai metadati, Catalog identifica tutti i database, i file e le tabelle utilizzati dal contenuto del sito di Tableau Online o di Tableau Server.

Catalog è disponibile con Data Management Add-on. Per maggiori informazioni, consulta Informazioni su Data Management Add-on.

Oltre a Catalog, i metadati sul contenuto sono accessibili sia dall'API dei metadati di Tableau(Link opens in a new window) che dall'API REST di Tableau Server utilizzando i Metodi di metadati(Link opens in a new window).

Prima di abilitare Catalog

Come amministratore di Tableau Server, vi sono alcuni elementi da tenere presente prima e durante l'abilitazione di Catalog per garantire prestazioni ottimali di Catalog nell'ambiente Tableau Server.

Versioni richieste

Prima di abilitare Catalog, assicurati di eseguire una delle seguenti versioni di Tableau Server:

  • Tableau Server 2019.3.4 o versione successiva
  • Tableau Server 2019.4.2 o versione successiva
  • Tableau Server 2020.1.0 o versione successiva
  • Tableau Server 2020.2.4 o versione successiva

Per maggiori informazioni sui motivi per cui sono richieste queste versioni, consulta la Knowledge Base di Tableau.

Cosa aspettarsi quando si abilita Catalog

Quando si abilita Catalog, il contenuto già presente in Tableau Server viene immediatamente indicizzato.

Inserimento iniziale

Il processo di indicizzazione è costituito da due componenti primari, uno dei quali è denominato inserimento iniziale. L'inserimento iniziale può essere suddiviso in due componenti aggiuntivi:

  • Backfill del contenuto
  • Backfill della derivazione

Lo stato del backfill del contenuto e del backfill della derivazione è importante da osservare in un secondo momento, quando si monitora lo stato di avanzamento e si verifica che Catalog sia stato attivato correttamente e sia in esecuzione nell'ambiente Tableau Server.

Velocità di inserimento iniziale

Il tempo necessario per l'indicizzazione iniziale dei contenuti da parte di Catalog dipende da due fattori:

  • Quantità di contenuti in Tableau Server: la quantità di contenuti è misurata dal numero totale di cartelle di lavoro, origini dati pubblicate e flussi pubblicati in Tableau Server. Per maggiori informazioni, consulta Spazio su disco per l'archiviazione dei metadati.

  • Numero di contenitori di microservizi non interattivi: Catalog utilizza il contenitore di microservizi non interattivi per indicizzare tutto il contenuto in Tableau Server. Per maggiori informazioni, consulta Memoria per i contenitori di microservizi non interattivi.

Comprendere i fattori che influiscono sull'inserimento iniziale può aiutare a misurare il tempo necessario per abilitare ed eseguire Catalog nell'ambiente.

Spazio su disco per l'archiviazione dei metadati

Durante l'inserimento iniziale, i metadati vengono generati e archiviati nel repository di Tableau Server (database PostgreSQL "relazione"). La quantità di spazio su disco necessaria per archiviare i metadati è circa la metà dello spazio su disco attualmente utilizzato dal repository (database PostgreSQL "gruppo di lavoro").

Supponendo ad esempio che il repository utilizzi 50 GB di spazio su disco prima di abilitare Catalog, il repository potrà utilizzare fino a 75 GB di spazio su disco dopo l'abilitazione di Catalog.

Memoria per i contenitori di microservizi non interattivi

L'inserimento iniziale viene eseguito all'interno del contenitore di microservizi non interattivi. Il contenitore di microservizi non interattivi è uno dei due processi per i contenitori di microservizi di Tableau Server(Link opens in a new window). Per impostazione predefinita, viene aggiunta un'istanza del contenitore di microservizi non interattivi a ogni nodo che dispone di un processo di Selezione background installato.

Per impostazione predefinita, l'inserimento iniziale in una singola istanza del contenitore di microservizi non interattivi può utilizzare fino a 4 GB di memoria nel nodo con Selezione background. Se la quantità di contenuti in Tableau Server è superiore a 10.000, un contenitore di microservizi non interattivi può richiedere fino a 16 GB di memoria nel nodo con Selezione background. Pertanto, quando abiliti Catalog, assicurati che ogni nodo con Selezione background disponga della capacità necessaria per supportare ogni contenitore di microservizi non interattivi durante il processo di inserimento iniziale. Se è necessario aumentare la capacità, devi aggiornare le dimensioni heap di JVM per i contenitori non interattivi in modo da allocare fino a 16 GB di memoria nei nodi con Selezione background. Per maggiori informazioni, consulta noninteractivecontainer.vmopts.

Se prevedi di aggiungere più contenitori di microservizi non interattivi per ridurre il tempo di inserimento iniziale, determina innanzitutto il numero totale di contenitori necessari (utilizzando il Passaggio 2: stimare il tempo necessario per l'inserimento iniziale, riportato di seguito) e quindi verifica se l'ambiente Tableau Server è configurato con una capacità sufficiente per supportare tutti i contenitori di microservizi non interattivi. A seconda di come è già configurato l'ambiente Tableau Server, potrebbe non essere possibile aggiungere tutti i contenitori di microservizi non interattivi aggiuntivi necessari per ridurre il tempo di inserimento iniziale.

Procedure consigliate per l'abilitazione di Catalog

Poiché la velocità di inserimento iniziale e i requisiti sono univoci per ogni ambiente Tableau Server, al momento dell'abilitazione di Catalog, Tableau consiglia di effettuare una o più delle operazioni seguenti:

  • Assicurati che lo spazio su disco possa essere utilizzato dal repository di Tableau Server per supportare i metadati aggiuntivi che verranno generati e archiviati dall'inserimento iniziale. Come regola generale, il repository richiederà un ulteriore 50% dello spazio su disco attualmente utilizzato dal repository. Per maggiori informazioni sull'utilizzo del disco di Tableau Server, consulta Spazio su disco del server.

  • A seconda della quantità di contenuti in Tableau Server, assicurati che ogni nodo con Selezione background abbia almeno 4-16 GB di memoria disponibile per ogni istanza di un contenitore di microservizi non interattivi durante l'inserimento iniziale.

  • Esegui il processo durante il fine settimana per consentire il completamento dell'inserimento iniziale prima che gli utenti inizino a usare le funzionalità di Catalog.

  • Esegui prima il processo in un ambiente di test con il contenuto di produzione. Ciò è dovuto al fatto che il tipo di contenuto che deve essere inserito può avere un ruolo significativo sulla velocità di inserimento.

Riepilogo dei passaggi per l'abilitazione di Catalog

I passaggi seguenti riepilogano il processo per attivare ed eseguire Catalog in Tableau Server. I passaggi devono essere eseguiti in sequenza.

  1. Determinare la quantità di contenuti in Tableau Server
  2. Stimare il tempo necessario per l'inserimento iniziale
  3. Ridurre il tempo dell'inserimento iniziale
  4. Attivare Data Management Add-on
  5. Disattivare le funzionalità di Catalog
  6. Eseguire il comando tsm maintenance metadata-services
  7. Monitorare l'avanzamento dell'inserimento iniziale e convalidarne lo stato
  8. Configurare SMTP
  9. Attivare le funzionalità di Catalog

Nota: questi passaggi possono essere utilizzati anche per abilitare l'API dei metadati di Tableau quando Tableau Server non è concesso in licenza con il Data Management Add-on.

Abilitare Catalog

Passaggio 1: determinare la quantità di contenuti in Tableau Server

Per determinare la quantità di contenuti in Tableau Server, procedi come segue:

  1. Accedi a Tableau Server tramite le tue credenziali di amministrazione.

  2. Vai alla pagina Esplora.

  3. Fai clic sul menu a discesa Progetti di livello superiore e somma i numeri accanto a Tutte le cartelle di lavoro, Tutte le origini dati e Tutti i flussi. Questa è la quantità totale di contenuti in Tableau Server.

Passaggio 2: stimare il tempo necessario per l'inserimento iniziale

Per stimare il tempo necessario a Catalog per inserire per la prima volta i contenuti in Tableau Server (inserimento iniziale), confronta la tua configurazione di Tableau Server con una configurazione di riferimento di Tableau Server.

Per un sistema Tableau Server con la seguente configurazione, il completamento dell'inserimento iniziale potrebbe richiedere circa 6 ore.

Componenti Valori di riferimento
Contenuto 17.000 cartelle di lavoro, origini dati pubblicate e flussi
Contenitori di microservizi non interattivi 10
Inserimento Circa 6 ore

Se disponi di circa la metà dei contenuti nel tuo ambiente Tableau Server, il completamento dell'inserimento iniziale potrebbe richiedere la metà del tempo.

Ad esempio: 8.500 (cartelle di lavoro, origini dati pubblicate e flussi) + 10 contenitori di microservizi interattivi = circa 3 ore (inserimento iniziale)

Se disponi di circa il doppio dei contenuti nel tuo ambiente Tableau Server, il completamento dell'inserimento iniziale potrebbe richiedere il doppio del tempo.

Ad esempio: 34.000 (cartelle di lavoro, origini dati pubblicate e flussi) + 10 contenitori di microservizi interattivi = circa 12 ore (inserimento iniziale)

Passaggio 3: ridurre il tempo dell'inserimento iniziale

Come regola generale, il tempo necessario a Catalog per eseguire l'inserimento iniziale è correlato al numero di contenitori di microservizi non interattivi. Per ridurre il tempo dell'inserimento iniziale, puoi aumentare il numero di contenitori di microservizi non interattivi.

Aumentare il numero di contenitori di microservizi non interattivi

Per impostazione predefinita, viene aggiunto un contenitore di microservizi non interattivi a ogni nodo che dispone di un processo di Selezione background. Per ridurre il tempo dell'inserimento iniziale, Tableau consiglia di aumentare il numero di contenitori di microservizi non interattivi utilizzando il comando tsm topology set-process.

  1. Apri un prompt dei comandi come amministratore sul nodo iniziale (in cui è installato TSM) del cluster.

  2. Esegui il comando: tsm topology set-process –-count <process_count> --<node_ID> --process <process_name>

    Ad esempio, per aumentare i contenitori di microservizi non interattivi nel nodo iniziale a 4 contenitori, esegui questo comando:

    tsm topology set-process –-count 4 –-n node1 --process noninteractive

    Per maggiori informazioni sull'esecuzione del comando e le relative opzioni globali, consulta tsm topology.

Importante: prima di aumentare il numero di contenitori di microservizi non interattivi, esamina le seguenti informazioni: 

  • La raccomandazione per l'aumento dei contenitori di microservizi non interattivi è relativa al numero totale di contenitori di microservizi non interattivi, non al totale dei contenitori di microservizi non interattivi per ogni nodo. Supponiamo ad esempio di avere 4 nodi, ma di voler aumentare il numero di contenitori non interattivi a 8. Il valore --count utilizzato nel comando tsm è 2.

  • Per ogni contenitore di microservizi non interattivi aggiunto, verranno utilizzati 4 GB di memoria aggiuntiva nel nodo e il carico verrà aggiunto al repository di Tableau Server (database PostgreSQL).

    • Tableau consiglia di aumentare in modo incrementale il numero di contenitori di microservizi non interattivi di non più di 2 alla volta, monitorando attentamente l'ambiente Tableau Server per evitare problemi con l'utilizzo della CPU del repository di Tableau Server (database PostgreSQL).

    • Tieni presente che quando vengono aggiunti troppi contenitori di microservizi non interattivi, l'utilizzo della CPU del database PostgreSQL potrebbe presentare un picco e causare un failover. I sintomi da tenere sotto controllo includono gli errori SQLException nei log di vizportal. Per maggiori informazioni, consulta l'argomento Failover del repository(Link opens in a new window).

Passaggio 4: attivare il Data Management Add-on

(Richiede il Data Management Add-on)

Se non è già stato fatto, puoi attivare il Data Management Add-on. Per maggiori informazioni, consulta Usare in licenza il componente aggiuntivo Data Management.

Passaggio 5 (facoltativo): disattivare le funzionalità di Catalog per ogni sito

(Richiede il Data Management Add-on)

Nell'ambito dell'attivazione del Data Management Add-on, le funzionalità di Catalog sono attivate per impostazione predefinita. A causa del processo di indicizzazione e del tempo stimato necessario per il completamento, potresti considerare la possibilità di disattivare temporaneamente le funzionalità di Catalog per ogni sito in modo che gli utenti di Tableau Server non possano accedere alle funzionalità di Catalog finché quest'ultimo non è pronto e in grado di fornire risultati completi e accurati.

  1. Accedi a Tableau Server tramite le tue credenziali di amministrazione.

  2. Dal pannello di navigazione a sinistra, fai clic su Impostazioni.

  3. Nella scheda Generale, in Tableau Catalog, deseleziona la casella di controllo Attiva Tableau Catalog.

  4. Ripeti i passaggi 2-3 per ogni sito in Tableau Server.

Passaggio 6: eseguire il comando tsm maintenance metadata-services

Esegui il comando tsm maintenance metadata-services per abilitare l'API dei metadati di Tableau. L'esecuzione del comando avvia l'inserimento iniziale. Se Tableau Server è concesso in licenza con Data Management Add-on, l'esecuzione del comando attiva anche le funzionalità di Catalog (se non è stato disattivato in precedenza).

  1. Apri un prompt dei comandi come amministratore sul nodo iniziale (in cui è installato TSM) del cluster.

  2. Esegui il comando: tsm maintenance metadata-services enable

    Per ulteriori informazioni sull'esecuzione del comando tsm, vedi manutenzione tsm(Link opens in a new window).

Note: quando esegui questo comando, tieni presente quanto segue:

  • Questo comando arresta e avvia alcuni servizi utilizzati da Tableau Server, il che fa sì che alcune funzionalità, come i suggerimenti, non siano temporaneamente disponibili per gli utenti.

  • In questa fase viene creato un nuovo indice dei metadati. Eseguendo questo comando le volte successive, verrà creato e sostituito l'indice precedente.

Passaggio 7: monitorare l'avanzamento dell'inserimento iniziale e convalidarne lo stato

L'esecuzione del comando tsm precedente avvia il processo di inserimento iniziale. Per garantire che il processo di inserimento iniziale venga eseguito senza problemi, puoi monitorarne l'avanzamento tramite l'API di backfill. Per maggiori informazioni, consulta Ottenere lo stato di inserimento iniziale.

Passaggio 8: configurare l'impostazione SMTP

Se non è già impostato per Tableau Server, configura l'impostazione SMTP. SMTP supporta l'invio di e-mail ai proprietari che hanno bisogno di essere contattati per modifiche ai dati. Per maggiori informazioni sulla configurazione SMTP, consulta Configurazione dell'impostazione SMTP(Link opens in a new window).

Passaggio 9 (facoltativo): attivare le funzionalità di Catalog

(Richiede il Data Management Add-on)

Se hai disattivato le funzionalità di Catalog prima di abilitare Catalog nel corso di una delle procedure precedenti, devi attivare Catalog per rendere le relative funzionalità accessibili agli utenti.

  1. Accedi a Tableau Server tramite le tue credenziali di amministrazione.

  2. Dal pannello di navigazione a sinistra, fai clic su Impostazioni.

  3. Nella scheda Generale, in Tableau Catalog, deseleziona la casella di controllo Attiva Tableau Catalog.

Risoluzione dei problemi relativi a Catalog

Gli utenti potrebbero riscontrare uno dei seguenti problemi durante l'utilizzo di Catalog (o dell'API dei metadati di Tableau).

Messaggi di superamento del limite di timeout e del limite del nodo

Per garantire che le attività di Catalog o le query dell'API dei metadati che devono restituire numerosi risultati non occupino tutte le risorse di sistema di Tableau Server, Catalog implementa sia limiti di timeout che del nodo.

  • Limite di timeout

    Quando le attività in Catalog o le query nell'API dei metadati raggiungono il limite di timeout, verrà visualizzato il seguente messaggio:

    "Visualizzazione di risultati parziali. Limite di tempo per la richiesta scaduto. Riprova più tardi." o TIME_LIMIT_LIMIT_EXCEEDEDED

    Per risolvere questo problema, come amministratore di Tableau Server, puoi aumentare il limite di timeout utilizzando il comando tsm configuration set –k metadata.query.limits.time. Per maggiori informazioni, consulta gli argomenti tsm configuration(Link opens in a new window) e Opzioni di tsm configuration set(Link opens in a new window).

    Importante: l'aumento del limite di timeout può comportare un maggiore utilizzo della CPU per un periodo superiore, che può influire sulle prestazioni di altri processi in Tableau Server.

  • Limite del nodo

    Quando le attività in Catalog o le query nell'API dei metadati raggiungono il limite del nodo, verrà visualizzato il seguente messaggio:

    NODE_LIMIT_EXCEEDED

    Per risolvere questo problema, come amministratore di Tableau Server, puoi aumentare il limite del nodo utilizzando il comando tsm configuration set –k metadata.query.limits.count. Per maggiori informazioni, consulta gli argomenti tsm configuration(Link opens in a new window) e Opzioni di tsm configuration set(Link opens in a new window).

    Importante: l'aumento del limite di timeout può influire sulla memoria del sistema.

Contenuto mancante

Se sospetti che, dopo l'inserimento iniziale, del contenuto non sia presente in Catalog o nell'API dei metadati, puoi usare l'API di gestione degli eventi per risolvere i problemi. La gestione degli eventi gestisce l'indicizzazione del contenuto in Tableau Server dopo l'inserimento iniziale. Per maggiori informazioni, consulta Ottenere lo stato di gestione degli eventi.

Disabilitare Catalog

In qualità di amministratore di Tableau Server, puoi disabilitare Catalog in due modi.

Disattivare le funzionalità di Catalog per ogni sito

(Richiede il Data Management Add-on)

Puoi disattivare le funzionalità di Catalog in qualsiasi momento. Quando le funzionalità di Catalog sono disattivate, le caratteristiche di Catalog, come l'aggiunta degli avvisi sulla qualità dei dati o la possibilità di gestire esplicitamente le autorizzazioni per le risorse di database e tabelle, non sono accessibili tramite Tableau Server (o l'API dei metadati di Tableau). Tuttavia, Catalog continua a indicizzare i contenuti pubblicati e i metadati sono accessibili dall'API di Tableau, mentre i metodi dei metadati sono disponibili nell'API REST di Tableau Server.

  1. Accedi a Tableau Server utilizzando le credenziali di amministratore.

  2. Dal pannello di navigazione a sinistra, fai clic su Impostazioni.

  3. Nella scheda Generale, in Tableau Catalog, deseleziona la casella di controllo Attiva Tableau Catalog.

Interrompere l'indicizzazione dei metadati su Tableau Server

Per interrompere l'indicizzazione del contenuto pubblicato su Tableau Server, puoi disattivare l'API dei metadati di Tableau. Per disabilitare l'API dei metadati, esegui il comando tsm maintenance metadata-services disable. Per maggiori informazioni, consulta tsm maintenance(Link opens in a new window).

Altri articoli in questa sezione

Grazie per il tuo feedback. Si è verificato un errore durante l'invio del feedback. Riprova o scrivici.