Abilitare Tableau Catalog

Tableau Catalog(Il collegamento viene aperto in una nuova finestra) individua e indicizza tutti i contenuti del sito Tableau Cloud o di Tableau Server, tra cui cartelle di lavoro, origini dati, fogli, metriche e flussi. (La funzionalità legacy Metriche verrà ritirata nella versione 2024.2 di Tableau Server e a febbraio 2024 per Tableau Cloud. Per maggiori informazioni, consulta Creare metriche e risolverne i problemi (ritirato).) L’indicizzazione è usata per raccogliere informazioni sul contenuto, o metadati, sullo schema e sulla derivazione del contenuto. Quindi, dai metadati, Catalog identifica tutti i database, i file e le tabelle utilizzati dal contenuto del sito di Tableau Cloud o di Tableau Server.

Catalog è disponibile con la licenza di Data Management. Per maggiori informazioni, consulta Informazioni su Data Management

Oltre a Catalog, i metadati sul contenuto sono accessibili sia dall’API dei metadati di Tableau(Il collegamento viene aperto in una nuova finestra) che dall’API REST di Tableau utilizzando i metodi per i metadati(Il collegamento viene aperto in una nuova finestra).

Prima di abilitare Catalog

Come amministratore di Tableau Server, vi sono alcuni elementi da tenere presente prima e durante l’abilitazione di Catalog per garantire prestazioni ottimali di Catalog nell’ambiente Tableau Server.

Versioni richieste

Prima di abilitare Catalog, assicurati di eseguire una delle seguenti versioni di Tableau Server:

  • Almeno Tableau Server 2019.3.4 o versione successiva
  • Almeno Tableau Server 2019.4.2 o versione successiva
  • Almeno Tableau Server 2020.1.0 o versione successiva
  • Almeno Tableau Server 2020.2.15 o versione successiva
  • Tableau Server 2020.3 e versioni successive

Per maggiori informazioni sui motivi per cui sono richieste queste versioni, consulta la Knowledge Base di Tableau.

Cosa aspettarsi quando si abilita Catalog

Quando si abilita Catalog, il contenuto già presente in Tableau Server viene immediatamente indicizzato.

Inserimento iniziale

Il processo di indicizzazione è costituito da due componenti primari, uno dei quali è denominato inserimento iniziale. L’inserimento iniziale può essere suddiviso in due componenti aggiuntivi:

  • Backfill del contenuto
  • Backfill della derivazione

Lo stato del backfill del contenuto e del backfill della derivazione è importante da osservare in un secondo momento, quando si monitora lo stato di avanzamento e si verifica che Catalog sia stato attivato correttamente e sia in esecuzione nell’ambiente Tableau Server.

Velocità di inserimento iniziale

Il tempo necessario per l’indicizzazione iniziale dei contenuti da parte di Catalog dipende da due fattori:

  • Quantità di contenuti in Tableau Server: la quantità di contenuti è misurata dal numero totale di cartelle di lavoro, metriche, origini dati pubblicate e flussi pubblicati in Tableau Server. Per maggiori informazioni, consulta Spazio su disco per l’archiviazione dei metadati.

  • Numero di contenitori di microservizi non interattivi: Catalog utilizza i contenitori di microservizi non interattivi per indicizzare tutto il contenuto in Tableau Server. Per maggiori informazioni, consulta Memoria per i contenitori di microservizi non interattivi.

Comprendere i fattori che influiscono sull’inserimento iniziale può aiutare a misurare il tempo necessario per abilitare ed eseguire Catalog nell’ambiente.

Spazio su disco per l’archiviazione dei metadati

Durante l’inserimento iniziale, i metadati vengono generati e archiviati nel repository di Tableau Server (database PostgreSQL "relazione"). La quantità di spazio su disco necessaria per archiviare i metadati è circa la metà dello spazio su disco attualmente utilizzato dal repository (database PostgreSQL "gruppo di lavoro").

Supponendo ad esempio che il repository utilizzi 50 GB di spazio su disco prima di abilitare Catalog, il repository potrà utilizzare fino a 75 GB di spazio su disco dopo l’abilitazione di Catalog.

Memoria per i contenitori di microservizi non interattivi

L’inserimento iniziale viene eseguito all’interno del contenitore di microservizi non interattivi. Il contenitore di microservizi non interattivi è uno dei due processi per i contenitori di microservizi di Tableau Server(Il collegamento viene aperto in una nuova finestra). Per impostazione predefinita, viene aggiunta un’istanza del processo del contenitore di microservizi non interattivi a ogni nodo che dispone di un processo di Selezione background installato.

Per impostazione predefinita, l’inserimento iniziale in una singola istanza del contenitore di microservizi non interattivi può utilizzare fino a 4 GB di memoria nel nodo con Selezione background. Se la quantità di contenuti in Tableau Server è superiore a 10.000, un processo di contenitore di microservizi non interattivi può richiedere fino a 16 GB di memoria nel nodo con Selezione background. Pertanto, quando abiliti Catalog, assicurati che ogni nodo con Selezione background disponga della capacità necessaria per supportare ogni contenitore di microservizi non interattivi durante il processo di inserimento iniziale. Se è necessario aumentare la capacità, devi aggiornare le dimensioni heap di JVM per i contenitori di microservizi non interattivi in modo da allocare fino a 16 GB di memoria nei nodi con Selezione background. Per maggiori informazioni, consulta noninteractive.vmopts.

Se prevedi di aggiungere più contenitori di microservizi non interattivi per ridurre il tempo di inserimento iniziale, determina innanzitutto il numero totale di contenitori necessari (utilizzando la Fase 2: stimare il tempo necessario per l’inserimento iniziale, riportata di seguito) e quindi verifica se l’ambiente Tableau Server è configurato con una capacità sufficiente per supportare tutti i contenitori di microservizi non interattivi. A seconda di come è già configurato l’ambiente Tableau Server, potrebbe non essere possibile aggiungere tutti i contenitori di microservizi non interattivi aggiuntivi necessari per ridurre il tempo di inserimento iniziale.

Procedure consigliate per l’abilitazione di Catalog

Poiché la velocità di inserimento iniziale e i requisiti sono univoci per ogni ambiente Tableau Server, al momento dell’abilitazione di Catalog, Tableau consiglia di effettuare una o più delle operazioni seguenti:

  • Assicurati che lo spazio su disco possa essere utilizzato dal repository di Tableau Server per supportare i metadati aggiuntivi che verranno generati e archiviati dall’inserimento iniziale. Come regola generale, il repository richiederà un ulteriore 50% dello spazio su disco attualmente utilizzato dal repository. Per maggiori informazioni sull’utilizzo del disco di Tableau Server, consulta Spazio su disco del server.

  • A seconda della quantità di contenuti in Tableau Server, assicurati che ogni nodo con Selezione background abbia almeno 4-16 GB di memoria disponibile per ogni istanza di un contenitore di microservizi non interattivi durante l’inserimento iniziale.

  • Esegui il processo durante il fine settimana per consentire il completamento dell’inserimento iniziale prima che gli utenti inizino a usare le funzionalità di Catalog.

  • Esegui prima il processo in un ambiente di test con il contenuto di produzione. Ciò è dovuto al fatto che il tipo di contenuto che deve essere inserito può avere un ruolo significativo sulla velocità di inserimento.

Riepilogo dei passaggi per l’abilitazione di Catalog

I passaggi seguenti riepilogano il processo per attivare ed eseguire Catalog in Tableau Server. I passaggi devono essere eseguiti in sequenza.

  1. Determinare la quantità di contenuti in Tableau Server
  2. Stimare il tempo necessario per l’inserimento iniziale
  3. Ridurre il tempo dell’inserimento iniziale
  4. Attivazione della licenza di Data Management
  5. Disattivare le funzionalità di Catalog
  6. Eseguire il comando tsm maintenance metadata-services
  7. Monitorare l’avanzamento dell’inserimento iniziale e convalidarne lo stato
  8. Configurare SMTP
  9. Attivare le funzionalità di Catalog

Nota: poiché l’indicizzazione dei metadati per il contenuto di Tableau in Tableau Server è basata sull’API dei metadati, per eseguire e utilizzare Catalog è necessaria l’abilitazione dell’API dei metadati.

Abilitare Catalog

Fase 1. Determinare la quantità di contenuti in Tableau Server

Per determinare la quantità di contenuti in Tableau Server, procedi come segue:

  1. Accedi a Tableau Server tramite le tue credenziali di amministrazione.

  2. Vai alla pagina Esplora.

  3. Fai clic sul menu a discesa Progetti di alto livello e somma i numeri accanto a Tutte le cartelle di lavoro, Tutte le metriche, Tutte le origini dati e Tutti i flussi. Questa è la quantità totale di contenuti in Tableau Server.

Fase 2. Stimare il tempo necessario per l’inserimento iniziale

Per stimare il tempo necessario a Catalog per inserire per la prima volta i contenuti in Tableau Server (inserimento iniziale), confronta la tua configurazione di Tableau Server con una configurazione di riferimento di Tableau Server.

Per un sistema Tableau Server con la seguente configurazione, il completamento dell’inserimento iniziale potrebbe richiedere circa 6 ore.

ComponentiValori di riferimento
Contenuto17.000 cartelle di lavoro, metriche, origini dati pubblicate e flussi
Contenitori di microservizi non interattivi10
InserimentoCirca 6 ore

Se disponi di circa la metà dei contenuti nel tuo ambiente Tableau Server, il completamento dell’inserimento iniziale potrebbe richiedere la metà del tempo.

Ad esempio: 8.500 (cartelle di lavoro, metriche, origini dati pubblicate e flussi) + 10 contenitori di microservizi non interattivi = circa 3 ore (inserimento iniziale)

Se disponi di circa il doppio dei contenuti nel tuo ambiente Tableau Server, il completamento dell’inserimento iniziale potrebbe richiedere il doppio del tempo.

Ad esempio: 34.000 (cartelle di lavoro, metriche, origini dati pubblicate e flussi) + 10 contenitori di microservizi non interattivi = circa 12 ore (inserimento iniziale)

Fase 3. Ridurre il tempo dell’inserimento iniziale

Come regola generale, il tempo necessario a Catalog per eseguire l’inserimento iniziale è correlato al numero di contenitori di microservizi non interattivi. Per ridurre il tempo dell’inserimento iniziale, puoi aumentare il numero di contenitori di microservizi non interattivi.

Aumentare il numero di contenitori di microservizi non interattivi

Per impostazione predefinita, viene aggiunto un contenitore di microservizi non interattivi a ogni nodo che dispone di un processo di Selezione background. Per ridurre il tempo dell’inserimento iniziale, Tableau consiglia di aumentare il numero di contenitori di microservizi non interattivi utilizzando il comando tsm topology set-process.

  1. Apri un prompt dei comandi come amministratore sul nodo iniziale (in cui è installato TSM) del cluster.

  2. Esegui il comando: tsm topology set-process --count <process_count> --node <node_ID> --process <process_name>

    Ad esempio, per aumentare i contenitori di microservizi non interattivi nel nodo iniziale a 4 contenitori, esegui questo comando:

    tsm topology set-process --count 4 –-node node1 --process noninteractive

    Per maggiori informazioni sull’esecuzione del comando e le relative opzioni globali, consulta tsm topology.

Importante: prima di aumentare il numero di contenitori di microservizi non interattivi, esamina le seguenti informazioni: 

  • La raccomandazione per l’aumento dei contenitori di microservizi non interattivi è relativa al numero totale di contenitori di microservizi non interattivi, non al totale dei contenitori di microservizi non interattivi per ogni nodo. Supponiamo ad esempio di avere 4 nodi, ma di voler aumentare il numero di contenitori non interattivi a 8. Il valore --count utilizzato nel comando tsm è 2.

  • Per ogni contenitore di microservizi non interattivi aggiunto, verranno utilizzati 4 GB di memoria aggiuntiva nel nodo e il carico verrà aggiunto al repository di Tableau Server (database PostgreSQL).

    • Tableau consiglia di aumentare in modo incrementale il numero di contenitori di microservizi non interattivi di non più di 2 alla volta, monitorando attentamente l’ambiente Tableau Server per evitare problemi con l’utilizzo della CPU del repository di Tableau Server (database PostgreSQL).

    • Tieni presente che quando vengono aggiunti troppi contenitori di microservizi non interattivi, l’utilizzo della CPU del database PostgreSQL potrebbe presentare un picco e causare un failover. I sintomi da tenere sotto controllo includono gli errori SQLException nei log di vizportal. Per maggiori informazioni, consulta l’argomento Failover del repository(Il collegamento viene aperto in una nuova finestra).

Passaggio 4: attivare la licenza di Data Management

(Richiede Data Management).

Se non l’hai già fatto, puoi attivare il Data Management. Per ulteriori informazioni, consulta Licenza di Data Management.

Fase 5 (facoltativo). Disattivare le funzionalità di Catalog per ogni sito

(Richiede Data Management).

Nell’ambito dell’attivazione di Data Management, le funzionalità di Catalog sono attivate per impostazione predefinita. A causa del processo di indicizzazione e del tempo stimato necessario per il completamento, potresti considerare la possibilità di disattivare temporaneamente le funzionalità di Catalog per ogni sito in modo che gli utenti di Tableau Server non possano accedere alle funzionalità di Catalog finché quest’ultimo non è pronto e in grado di fornire risultati completi e accurati.

  1. Accedi a Tableau Server tramite le tue credenziali di amministrazione.

  2. Dal pannello di navigazione a sinistra, fai clic su Impostazioni.

  3. Nella scheda Generale, in Tableau Catalog, deseleziona la casella di controllo Attiva Tableau Catalog.

  4. Ripeti le fasi 2-3 per ogni sito in Tableau Server.

Fase 6. Eseguire il comando tsm maintenance metadata-services

Esegui il comando tsm maintenance metadata-services per abilitare l’API dei metadati di Tableau. L’esecuzione del comando avvia l’inserimento iniziale. Se Tableau Server è concesso in licenza con Data Management, l’esecuzione del comando attiva anche le funzionalità di Catalog (se non è stato disattivato in precedenza).

  1. Apri un prompt dei comandi come amministratore sul nodo iniziale (in cui è installato TSM) del cluster.

  2. Esegui il comando: tsm maintenance metadata-services enable

    Per ulteriori informazioni sull’esecuzione del comando tsm, vedi manutenzione tsm(Il collegamento viene aperto in una nuova finestra).

Note: quando esegui questo comando, tieni presente quanto segue:

  • Questo comando arresta e avvia alcuni servizi utilizzati da Tableau Server, il che fa sì che alcune funzionalità, come i suggerimenti, non siano temporaneamente disponibili per gli utenti.

  • In questa fase viene creato un nuovo indice dei metadati. Eseguendo questo comando le volte successive, verrà creato e sostituito l’indice precedente.

Fase 7. Monitorare l’avanzamento dell’inserimento iniziale e convalidarne lo stato

L’esecuzione del comando tsm precedente avvia il processo di inserimento iniziale. Per garantire che il processo di inserimento iniziale venga eseguito senza problemi, puoi monitorarne l’avanzamento tramite l’API di backfill. Per maggiori informazioni, consulta Ottenere lo stato di inserimento iniziale.

Fase 8. Configurare l’impostazione SMTP

Se non è già impostato per Tableau Server, configura l’impostazione SMTP. SMTP supporta l’invio di e-mail ai proprietari che hanno bisogno di essere contattati per modifiche ai dati. Per maggiori informazioni sulla configurazione SMTP, consulta Configurazione dell’impostazione SMTP(Il collegamento viene aperto in una nuova finestra).

Fase 9 (facoltativo). Attivare le funzionalità di Catalog per ogni sito

(Richiede Data Management).

Se hai disattivato le funzionalità di Catalog prima di abilitare Catalog nel corso di una delle procedure precedenti, devi attivare Catalog per rendere le relative funzionalità accessibili agli utenti.

  1. Accedi a Tableau Server tramite le tue credenziali di amministrazione.

  2. Dal pannello di navigazione a sinistra, fai clic su Impostazioni.

  3. Nella scheda Generale, in Tableau Catalog, seleziona la casella di controllo Attiva Tableau Catalog.

  4. Ripeti le fasi 2-3 per ogni sito in Tableau Server.

Risoluzione dei problemi relativi a Catalog

Gli utenti potrebbero riscontrare uno dei seguenti problemi durante l’utilizzo di Catalog.

Messaggi di superamento del limite di timeout e del limite del nodo

Per garantire che le attività di Catalog che devono restituire numerosi risultati non occupino tutte le risorse di sistema di Tableau Server, Catalog implementa sia limiti di timeout che del nodo.

Contenuto mancante

  • Se sospetti che, dopo l’inserimento iniziale, del contenuto non sia presente in Catalog, puoi usare l’API di gestione degli eventi per risolvere i problemi. La gestione degli eventi gestisce l’indicizzazione del contenuto in Tableau Server dopo l’inserimento iniziale. Per maggiori informazioni, consulta Ottenere lo stato di gestione degli eventi.

  • Quando viene rimossa la connessione tra una risorsa esterna incorporata e il relativo contenuto Tableau a valle, la risorsa rimane in Catalog (o nell’API dei metadati di Tableau) finché non viene automaticamente eliminata da un processo di Gestione componenti in background che viene eseguito ogni giorno alle 22:00:00 UTC (tempo coordinato universale). Ad esempio, supponiamo che una cartella di lavoro, inizialmente pubblicata con un file di testo incorporato A, venga ripubblicata con un file di testo incorporato B. Il file A rimane visibile (o utilizzabile per le query) come risorsa esterna finché i processi di Gestione componenti in background non sono in grado di eliminarlo.

    Puoi disabilitare l’esecuzione di questo processo di Gestione componenti in background se non vuoi rimuovere questi tipi di risorse esterne o se ritieni che occupi risorse di sistema che non desideri dedicare a questo processo. In alternativa, puoi regolare il numero di risorse incorporate esterne che vengono eliminate. Per maggiori informazioni, consulta features.DeleteOrphanedEmbeddedDatabaseAsset e databaseservice.max_database_deletes_per_run.

    Puoi monitorare questo processo in due modi:

    • Filtra il tipo di attività Processo singolo per ricanonizzare le risorse di database/tabelle esistenti dopo una modifica della logica di canonizzazione nella vista amministratore Attività in background per non estrazioni.

    • Fai riferimento agli eventi Rimozione dei database incorporati orfani completata o database_service_canonicalization_change nei file di log di Tableau Server.

Prestazioni dopo l’inserimento iniziale

In alcuni ambienti Tableau Server in cui contenuto specifico viene aggiornato molto di frequente (ad esempio, tramite pianificazioni con una frequenza elevata o richieste della riga di comando o dell’API), il processo di indicizzazione potrebbe raggiungere la saturazione. In questi casi, l’amministratore del server può valutare se abilitare la limitazione degli eventi per migliorare le prestazioni di Catalog. Per maggiori informazioni, consulta metadata.ingestor.pipeline.throttleEventsEnable.

Nota: quando la limitazione degli eventi è abilitata, gli utenti potrebbero notare un ritardo previsto nelle modifiche dei contenuti in Catalog.

Errori di memoria insufficiente

In alcuni casi, possono verificarsi errori di memoria insufficiente di Tableau Server a causa di problemi relativi all’inserimento di contenuto complesso. Se sospetti che l’inserimento sia la causa degli errori di memoria insufficiente in Tableau Server, collabora con l’assistenza di Tableau per evitare l’inserimento nelle metadata.ingestor.blocklist per risolvere il problema.

Disabilitare Catalog

In qualità di amministratore di Tableau Server, puoi disabilitare Catalog in due modi.

Disattivare le funzionalità di Catalog per ogni sito

(Richiede Data Management).

Puoi disattivare le funzionalità di Catalog in qualsiasi momento. Quando le funzionalità di Catalog sono disattivate, le caratteristiche di Catalog, come l’aggiunta degli avvisi sulla qualità dei dati o la possibilità di gestire esplicitamente le autorizzazioni per le risorse di database e tabelle, non sono accessibili tramite Tableau Server. Tuttavia, Catalog continua a indicizzare i contenuti pubblicati e i metadati sono accessibili dall’API di Tableau, mentre i metodi dei metadati sono disponibili nell’API REST di Tableau.

  1. Accedi a Tableau Server utilizzando le credenziali di amministratore.

  2. Dal pannello di navigazione a sinistra, fai clic su Impostazioni.

  3. Nella scheda Generale, in Tableau Catalog, deseleziona la casella di controllo Attiva Tableau Catalog.

Interrompere l’indicizzazione dei metadati su Tableau Server

Per interrompere l’indicizzazione del contenuto pubblicato su Tableau Server, puoi disattivare l’API dei metadati di Tableau. Per disabilitare l’API dei metadati, esegui il comando tsm maintenance metadata-services disable. Per maggiori informazioni, consulta tsm maintenance(Il collegamento viene aperto in una nuova finestra).

Grazie per il tuo feedback.Il tuo feedback è stato inviato. Grazie!