Habilitar Tableau Catalog
Tableau Catalog(El enlace se abre en una ventana nueva) descubre e indexa todo el contenido de su sitio de Tableau Cloud o Tableau Server, incluidos libros de trabajo, fuentes de datos, hojas, métricas y flujos. (La funcionalidad heredada Métricas se retiró de Tableau Cloud en febrero de 2024 y Tableau Server en la versión 2024.2. Para obtener más información, consulte Crear y solucionar problemas de métricas (Retirado).) La indexación se utiliza para recopilar información sobre el contenido, o los metadatos, el esquema y el linaje del contenido. Luego, a partir de los metadatos, Catalog identifica todas las bases de datos, los archivos y las tablas utilizadas por el contenido de su sitio de Tableau Cloud o Tableau Server.
El catálogo está disponible con la licencia de Data Management. Para obtener más información, consulte Acerca de Data Management
Además de Catalog, también se puede acceder a los metadatos sobre su contenido desde la API de metadatos de Tableau(El enlace se abre en una ventana nueva) y la API de REST de Tableau utilizando métodos de metadatos(El enlace se abre en una ventana nueva).
Antes de habilitar Catalog
Como administrador de Tableau Server, hay algunas cosas que debe tener en cuenta para permitir que Catalog tenga un rendimiento óptimo en su entorno de Tableau Server.
Versiones necesarias
Antes de habilitar Catalog, asegúrese de que está ejecutando una de las siguientes versiones de Tableau Server para garantizar una experiencia de Catalog óptima:
- Como mínimo Tableau Server 2019.3.4 o versiones posteriores
- Como mínimo Tableau Server 2019.4.2 o versiones posteriores
- Como mínimo Tableau Server 2020.1.0 o versiones posteriores
- Como mínimo Tableau Server 2020.2.15 o versiones posteriores
- Tableau Server 2020.3 y versiones posteriores
Para obtener más información sobre por qué estas versiones son necesarias, consulte la base de conocimientos de Tableau.
Qué esperar al habilitar Catalog
Cuando se habilita Catalog, el contenido existente de Tableau Server se indexa automáticamente.
Ingesta inicial
El proceso de indexación se compone de dos componentes principales, uno de los cuales se denomina ingesta inicial. La ingesta inicial se puede desglosar en dos componentes adicionales:
- Relleno de contenido
- Relleno de linaje
El estado del relleno de contenido y el relleno de linaje es importante a la hora de supervisar el progreso y validar que Catalog se ha habilitado correctamente y se está ejecutando en su entorno de Tableau Server.
Velocidad de ingesta inicial
El tiempo que tarda Catalog en indexar el contenido por primera vez depende de un par de factores:
Cantidad de contenido en Tableau Server: La cantidad de contenido se mide por el número total de libros de trabajo, métricas, fuentes de datos publicadas y flujos publicados en Tableau Server. Para obtener más información, consulte Espacio en disco para almacenar metadatos.
Número de contenedor de microservicios no interactivos Catalog utiliza contenedores de microservicios no interactivos para indexar todo el contenido en Tableau Server. Para obtener más información, consulte Memoria para contenedores de microservicios no interactivos.
Comprender los factores que afectan a la ingesta inicial puede ayudarle a medir cuánto tiempo puede tardar en habilitar y ejecutar Catalog en su entorno.
Espacio en disco para almacenar metadatos
Durante la ingesta inicial, los metadatos se generan y almacenan en el repositorio de Tableau Server ("relación" en las bases de datos PostgreSQL). La cantidad de espacio en disco necesaria para almacenar los metadatos es aproximadamente la mitad del espacio en disco utilizado actualmente por el repositorio ("grupo de trabajo" de las bases de datos PostgreSQL).
Por ejemplo, supongamos que el repositorio utiliza 50 GB de espacio en disco antes de habilitar Catalog, el repositorio puede utilizar hasta 75 GB de espacio en disco después de habilitar Catalog.
Memoria para contenedores de microservicios no interactivos
La ingesta inicial se ejecuta dentro del contenedor de microservicios no interactivos. El contenedor de microservicios no interactivos es uno de los dos procesos de contenedores de microservicios de Tableau Server(El enlace se abre en una ventana nueva). De forma predeterminada, se agrega una instancia del contenedor de microservicios no interactivos a cada nodo que tenga un procesador en segundo plano proceso de servidor.
De forma predeterminada, la ingesta inicial en una única instancia del contenedor de microservicios no interactivos puede usar hasta 4 GB de memoria en el nodo del procesador en segundo plano. Si la cantidad de contenido de Tableau Server supera los 10 000, el procesador de un contenedor de microservicios no interactivos puede necesitar hasta 16 GB de memoria en el nodo del procesador en segundo plano. Por lo tanto, al habilitar Catalog, asegúrese de que cada nodo del procesador en segundo plano tiene la capacidad disponible para admitir cada contenedor de microservicios no interactivos durante el proceso de ingesta inicial. Si es necesario aumentar la capacidad, debe actualizar el tamaño de la pila JVM para que los contenedores no interactivos asignen hasta 16 GB de memoria en los nodos del procesador en segundo plano. Para obtener más información, consulte noninteractive.vmopts.
Si tiene previsto agregar más contenedores de microservicios no interactivos para reducir el tiempo de ingesta inicial, primero determine cuántos contenedores totales se necesitan (mediante Paso 2: Estimar cuánto tiempo tardará la ingesta inicial) y, a continuación, compruebe si su entorno de Tableau Server está configurado con la capacidad suficiente para admitir todos los contenedores de microservicios no interactivos. En función de la configuración actual del entorno de Tableau Server, es posible que no pueda agregar todos los contenedores adicionales que no sean microservicios no interactivos y que necesite para reducir el tiempo de ingesta inicial.
Prácticas recomendadas para habilitar Catalog
Dado que la velocidad de la ingesta inicial y sus requisitos son exclusivos de cada entorno de Tableau Server, Tableau recomienda que, al habilitar Catalog, realice una o varias de las siguientes acciones:
Asegúrese de que hay suficiente espacio en disco que el repositorio de Tableau Server pueda usar para admitir los metadatos adicionales que generará y almacenará la ingesta inicial. Como regla general, el repositorio necesitará un 50% adicional del espacio en disco que utiliza actualmente el repositorio. Para obtener más información sobre el uso del disco de Tableau Server, consulte Espacio en el disco del servidor.
En función de la cantidad de contenido de Tableau Server, asegúrese de que cada nodo de contenedor en segundo plano tenga al menos entre 4 y 16 GB de memoria disponible para cada instancia de un contenedor de microservicios no interactivos durante la ingesta inicial.
Realice el proceso durante el fin de semana para permitir que se complete la ingesta inicial antes de que los usuarios comiencen a usar las funcionalidades de Catalog.
Realice el proceso en un entorno de prueba con contenido de producción primero. Esto se debe a que el tipo de contenido que se debe ingerir puede desempeñar un papel importante en la velocidad de ingesta.
Resumen de los pasos para habilitar Catalog
Los pasos siguientes resumen el proceso para activar y ejecutar Catalog en Tableau Server. Los pasos deben realizarse secuencialmente.
- Determinar la cantidad de contenido en Tableau Server
- Estimar cuánto tiempo tardará la ingesta inicial
- Disminuir el tiempo de ingesta inicial
- Activación de la licencia de Data Management
- Desactivar las funcionalidades de Catalog
- Ejecutar el comando tsm maintenance metadata-services
- Supervisar el progreso de la ingesta inicial y validar su estado
- Configurar SMTP
- Activar las funcionalidades de Catalog
Nota: Dado que la indexación de metadatos sobre contenido de Tableau en Tableau Sever funciona con la API de metadatos, es necesario habilitar la API de metadatos para ejecutar y utilizar Catalog.
Habilitar Catalog
Paso 1: Determinar la cantidad de contenido en Tableau Server
Para determinar la cantidad de contenido en Tableau Server, haga lo siguiente:
Inicie sesión en Tableau Server con sus credenciales de administrador.
Vaya a la página Explorar.
Haga clic en el menú desplegable Proyecto superior y agregue los números junto a Todos los libros de trabajo, Todas las métricas, Todas las fuentes de datos y Todos los flujos juntos. Esta es la cantidad total de contenido en Tableau Server.
Paso 2: calcular cuánto tiempo llevará la ingesta inicial
Para estimar el tiempo que tardará Catalog en ingerir contenido en el Tableau Server por primera vez (ingesta inicial), compare la configuración de su Tableau Server con la configuración de Tableau Server de referencia.
Para Tableau Server con la siguiente configuración, la ingestión inicial puede tardar unas 6 horas en completarse.
Componentes | Valores de referencia |
---|---|
Contenido | 17 000 libros de trabajo, métricas, fuentes de datos publicadas y flujos |
Contenedor de microservicios no interactivos | 10 |
Ingestión | ~6 horas |
Si tiene aproximadamente la mitad del contenido en su entorno de Tableau Server, la ingestión inicial puede tardar la mitad del tiempo en completarse.
Por ejemplo: 8500 (libros de trabajo, métricas, fuentes de datos publicadas y flujos) + 10 contenedores de microservicios no interactivos = ~ 3 horas (ingesta inicial)
Si tiene aproximadamente el doble de contenido en su entorno de Tableau Server, la ingestión inicial puede tardar el doble de tiempo en completarse.
Por ejemplo: 34 000 (libros de trabajo, métricas, fuentes de datos publicadas y flujos) + 10 contenedores de microservicios no interactivos = ~ 12 horas (ingesta inicial)
Paso 3: disminuir el tiempo de ingesta inicial
Como regla general, el tiempo que tarda Catalog en realizar la ingesta inicial está relacionado con el número de contenedores de microservicios no interactivos. Para ayudar a reducir el tiempo de ingesta inicial, puede aumentar el número de contenedores de microservicios no interactivos.
Aumente el número de contenedores de microservicios no interactivos
De forma predeterminada, se agrega un contenedor de microservicios no interactivos a cada nodo que tenga un procesador en segundo plano. Para ayudar a reducir el tiempo de ingesta inicial, Tableau recomienda aumentar el número de contenedores de microservicios no interactivos mediante el comando tsm topology set-process
.
Abra un símbolo del sistema como administrador en el nodo inicial (nodo en el que esté instalado TSM).
Ejecute el comando
tsm topology set-process --count <process_count> --node <node_ID> --process <process_name>
Por ejemplo, para aumentar el contenedor de microservicios no interactivos en el nodo inicial a 4 contenedores, ejecute el siguiente comando:
tsm topology set-process --count 4 –-node node1 --process noninteractive
Para obtener más información sobre cómo ejecutar el comando y sus opciones globales, consulte tsm topology.
Importante: Antes de aumentar el número de contenedores de microservicios no interactivos, revise lo siguiente:
La recomendación para aumentar los contenedores de microservicios no interactivos es para el número total de contenedores de microservicios no interactivos, no para contenedores de microservicios no interactivos totales por nodo. Por ejemplo, supongamos que tiene 4 nodos, pero desea aumentar el número de contenedores de microservicios no interactivos a 8. El valor
--count
que se utiliza en el comando tsm es 2.Para cada contenedor de microservicios no interactivo agregado, se utilizarán 4 GB de memoria adicional en el nodo y la carga se agregará al repositorio de Tableau Server (base de datos PostreSQL).
Tableau recomienda que aumente progresivamente el número de hilos en 2 (no más) cada vez mientras monitoriza de cerca el entorno de Tableau Server para evitar problemas con la utilización de la CPU del repositorio de Tableau Server (base de datos PostgreSQL).
Tenga en cuenta que cuando se añaden demasiados microservicios no interactivos, la utilización de la CPU de la base de datos PostgreSQL puede aumentar y provocar una conmutación por error. Los síntomas que se deben tner en cuenta incluyen errores de SQLException en los registros de vizportal. Para obtener más información, consulte Conmutación por error del repositorio(El enlace se abre en una ventana nueva).
Paso 4: Activar la licencia de Data Management
(Requiere Data Management)
Si aún no lo ha hecho, puede activar Data Management. Para obtener más información, consulte Licencia de Data Management
Paso 5 (opcional): Desactivar las funcionalidades de Catalog para cada sitio
(Requiere Data Management)
Como parte de la activación de Data Management, las funcionalidades de Catalog están activadas de forma predeterminada. Debido al proceso de indexación y al tiempo estimado que se tarda en completarlo, recomendamos desactivar las funcionalidades de Catalog temporalmente para que los usuarios de Tableau Server no puedan acceder a las funcionalidades de Catalog hasta que estén listas para usarse de forma completa y eficaz.
Inicie sesión en Tableau Server con sus credenciales de administrador.
En el panel de navegación de la izquierda, haga clic en Configuración.
En la pestaña General, en Tableau Catalog, desactive la casilla Activar Tableau Catalog.
Repita los pasos del 2 al 3 para cada sitio de Tableau Server.
Paso 6: ejecutar el comando tsm maintenance metadata-services
Ejecute el comando tsm maintenance metadata-services
para habilitar la API de metadatos de Tableau. Al ejecutar el comando, comienza la ingesta inicial. Si Tableau Server tiene licencia con Data Management, al ejecutar el comando también se activan las funcionalidades de Catalog (si no se han desactivado anteriormente).
Abra un símbolo del sistema como administrador en el nodo inicial (nodo en el que esté instalado TSM).
Ejecute el comando
tsm maintenance metadata-services enable
Para obtener más información sobre cómo ejecutar el comando tsm, consulte Mantenimiento de TSM(El enlace se abre en una ventana nueva).
Nota: Al ejecutar este comando, tenga en cuenta lo siguiente:
Este comando detiene e inicia algunos de los servicios utilizados por Tableau Server, lo que provoca que ciertas funciones, como las Recomendaciones, no estén disponibles temporalmente.
En este momento se crea un nuevo índice de metadatos. Al ejecutar este comando en cualquier momento posterior, se creará y reemplazará el índice anterior.
Paso 7: supervisar el progreso de la ingesta inicial y validar su estado
Al ejecutar el comando tsm anterior, se inicia el proceso de ingesta inicial. Para asegurar que la ingestión inicial se realice correctamente, puede supervisar su avance utilizando la API de relleno. Para obtener más información, consulte Obtener el estado de ingesta inicial.
Paso 8: configurar la instalación de SMTP.
Si aún no está configurado para Tableau Server, configure la instalación de SMTP. SMTP admite el envío de correos electrónicos a los propietarios que necesitan que se pongan en contacto con ellos con respecto a los cambios en los datos. Para obtener más información sobre cómo configurar SMTP, consulte Configurar la instalación de SMTP(El enlace se abre en una ventana nueva).
Paso 9 (opcional): activar las funcionalidades de Catalog para cada sitio
(Requiere Data Management)
Si desactivó las funcionalidades de Catalog, antes de habilitar Catalog en uno de los procedimientos anteriores, debe activarlo para que los usuarios puedan usar sus funcionalidades.
Inicie sesión en Tableau Server con sus credenciales de administrador.
En el panel de navegación de la izquierda, haga clic en Configuración.
En la pestaña General, en Tableau Catalog, seleccione la casilla de verificación Activar Tableau Catalog.
Repita los pasos del 2 al 3 para cada sitio de Tableau Server.
Solución de problemas de Catalog
Es posible que usted o sus usuarios encuentren uno de los siguientes problemas al usar Catalog.
Mensajes de límite de tiempo de espera y de límite de nodos excedido
Para garantizar que las tareas de Catalog que tienen que devolver un gran número de resultados no ocupen todos los recursos del sistema de
Límite de tiempo de espera
Cuando las tareas de Catalog alcanzan el límite de tiempo de espera, usted y sus usuarios verán el siguiente mensaje:
"Mostrando resultados parciales. Se ha excedido el límite de tiempo de espera. Vuelva a intentarlo más tarde" o TIME_LIMIT_EXCEEDED
Para resolver este problema, como administrador de Tableau Server, puede aumentar el límite de tiempo de espera usando el comando
tsm configuration set –k metadata.query.limits.time
. Para obtener más información, consulte Configuración tsm(El enlace se abre en una ventana nueva) y Opciones de conjunto de configuración de tsm(El enlace se abre en una ventana nueva).Importante: Aumentar el límite de tiempo de espera puede utilizar más CPU durante más tiempo, lo que puede afectar al rendimiento de otros procesos en Tableau Server.
Límite de nodos
Cuando las tareas de Catalog alcancen el límite de nodos, usted y sus usuarios verán el siguiente mensaje:
NODE_LIMIT_EXCEEDED
Para resolver este problema, como administrador de Tableau Server, puede aumentar el límite de nodos usando el comando
tsm configuration set –k metadata.query.limits.count
. Para obtener más información, consulte Configuración tsm(El enlace se abre en una ventana nueva) y Opciones de conjunto de configuración de tsm(El enlace se abre en una ventana nueva).Importante: Aumentar el límite de tiempo de espera puede afectar a la memoria del sistema.
Falta de contenido
Si sospecha que, después de la ingesta inicial, falta contenido de Catalog, puede usar la API de eventos para ayudar a solucionar problemas. Los eventos controlan el contenido de indexación en Tableau Server después de la ingesta inicial. Para obtener más información, consulte Obtener el estado de los eventos.
Cuando se elimina la conexión entre un activo externo insertado y su contenido posterior de Tableau, permanece en Catalog (o en la API de metadatos de Tableau) hasta que se elimina automáticamente mediante un proceso en segundo plano que se ejecuta todos los días a las 22:00:00 UTC (hora universal coordinada). Por ejemplo, suponga que un libro de trabajo, publicado inicialmente con un archivo de texto insertado A, se vuelve a publicar con un archivo de texto insertado B. El archivo A permanece visible (o se puede consultar) como un activo externo hasta que los procesos en segundo plano puedan eliminarlo.
Puede desactivar la ejecución de este proceso en segundo plano si no desea eliminar este tipo de activos externos o si cree que consume recursos del sistema que no desea dedicar a este proceso. Alternativamente, puede ajustar la cantidad de activos integrados externos que se eliminan. Para obtener más información, consulte features.DeleteOrphanedEmbeddedDatabaseAsset y databaseservice.max_database_deletes_per_run.
Puede supervisar este proceso de una de estas dos maneras:
Filtrar el trabajo de una sola vez volver a canonicalizar los activos de base de datos/tablas existentes después de un tipo de tarea de cambio de lógica de canonicalización en la vista de administración Tareas en segundo plano para elementos que no son extracciones.
Consulte Eliminación finalizada de bases de datos insertadas huérfanas o Eventos database_service_canonicalization_change en los archivos de registro de Tableau Server.
Rendimiento después de la ingesta inicial
En algunos entornos de Tableau Server en los que el contenido específico que se actualiza con mucha frecuencia (por ejemplo, mediante programas de alta frecuencia o solicitudes de línea de comandos o API), el proceso de indexación podría sobresaturarse. En estos casos, como administrador del servidor, debería habilitar la limitación de eventos para mejorar el rendimiento de Catalog. Para obtener más información, consulte metadata.ingestor.pipeline.throttleEventsEnable.
Nota: Cuando se habilita la limitación de eventos, es posible que los usuarios observen un retraso previsto en los cambios de contenido en Catalog.
Errores de memoria insuficiente
En algunos casos, se pueden producir errores de memoria insuficiente en Tableau Server como resultado de problemas con la ingesta de contenido complejo. Si sospecha que la ingesta es la causa de errores de memoria insuficiente en Tableau Server, póngase en contacto con el equipo de soporte de Tableau para configurar que no se ingieran las metadata.ingestor.blocklist y poder resolver el problema.
Deshabilitar Catalog
Puede deshabilitar Catalog de una de estas dos formas.
Desactivar las funcionalidades de Catalog para cada sitio
(Requiere Data Management)
Puede desactivar las funcionalidades de Catalog en cualquier momento. Cuando las funcionalidades de Catalog están desactivadas, no es posible acceder a sus funciones, como la capacidad de añadir advertencias de calidad sobre los datos o administrar explícitamente los permisos de los activos de la base de datos y las tablas. Sin embargo, Catalog continúa indexando el contenido publicado y se puede acceder a los metadatos desde la API de metadatos de Tableau y los métodos de metadatos en la API de REST de Tableau.
- Inicie sesión en Tableau Server con sus credenciales de administrador.
- En el panel de navegación de la izquierda, haga clic en Configuración.
- En la pestaña General, en Tableau Catalog, desactive la casilla Activar Tableau Catalog.
Dejar de indexar metadatos
Para dejar de indexar el contenido publicado en Tableau Server, puede deshabilitar la API de metadatos de Tableau. Para desactivar la API de metadatos, ejecute el comando tsm maintenance metadata-services disable
. Para obtener más información, consulte tsm maintenance(El enlace se abre en una ventana nueva).