Habilitar Tableau Catalog

Tableau Catalog(El enlace se abre en una ventana nueva) descubre e indexa todo el contenido de su sitio de Tableau Online o Tableau Server, incluidos libros de trabajo, fuentes de datos, hojas, métricas y flujos. La indexación se utiliza para recopilar información sobre el contenido, o los metadatos, el esquema y el linaje del contenido. Luego, a partir de los metadatos, Catalog identifica todas las bases de datos, los archivos y las tablas utilizadas por el contenido de su sitio de Tableau Online o Tableau Server.

El catálogo está disponible con Complemento de administración de datos. Para obtener más información, consulte Sobre el Complemento de administración de datos.

Además de Catalog, también se puede acceder a los metadatos sobre su contenido desde la API de metadatos de Tableau(El enlace se abre en una ventana nueva) y la API de REST de Tableau utilizando métodos de metadatos(El enlace se abre en una ventana nueva).

Antes de habilitar Catalog

Como administrador de Tableau Server, hay algunas cosas que debe tener en cuenta para permitir que Catalog tenga un rendimiento óptimo en su entorno de Tableau Server.

Versiones necesarias

Antes de habilitar Catalog, asegúrese de que está ejecutando una de las siguientes versiones de Tableau Server para garantizar una experiencia de Catalog óptima:

  • Como mínimo Tableau Server 2019.3.4 o versiones posteriores
  • Como mínimo Tableau Server 2019.4.2 o versiones posteriores
  • Como mínimo Tableau Server 2020.1.0 o versiones posteriores
  • Como mínimo Tableau Server 2020.2.15 o versiones posteriores
  • Tableau Server 2020.3 y versiones posteriores

Para obtener más información sobre por qué estas versiones son necesarias, consulte la base de conocimientos de Tableau.

Qué esperar al habilitar Catalog

Cuando se habilita Catalog, el contenido existente de Tableau Server se indexa automáticamente.

Ingesta inicial

El proceso de indexación se compone de dos componentes principales, uno de los cuales se denomina ingesta inicial. La ingesta inicial se puede desglosar en dos componentes adicionales:

  • Relleno de contenido
  • Relleno de linaje

El estado del relleno de contenido y el relleno de linaje es importante a la hora de supervisar el progreso y validar que Catalog se ha habilitado correctamente y se está ejecutando en su entorno de Tableau Server.

Velocidad de ingesta inicial

El tiempo que tarda Catalog en indexar el contenido por primera vez depende de un par de factores:

  • Cantidad de contenido en Tableau Server: La cantidad de contenido se mide por el número total de libros de trabajo, métricas, fuentes de datos publicadas y flujos publicados en Tableau Server. Para obtener más información, consulte Espacio en disco para almacenar metadatos.

  • Número de contenedor de microservicios no interactivos  Catalog utiliza el contenedor de microservicios no interactivos para indexar todo el contenido en Tableau Server. Para obtener más información, consulte Memoria para contenedores de microservicios no interactivos.

Comprender los factores que afectan a la ingesta inicial puede ayudarle a medir cuánto tiempo puede tardar en habilitar y ejecutar Catalog en su entorno.

Espacio en disco para almacenar metadatos

Durante la ingesta inicial, los metadatos se generan y almacenan en el repositorio de Tableau Server ("relación" en las bases de datos PostgreSQL). La cantidad de espacio en disco necesaria para almacenar los metadatos es aproximadamente la mitad del espacio en disco utilizado actualmente por el repositorio ("grupo de trabajo" de las bases de datos PostgreSQL).

Por ejemplo, supongamos que el repositorio utiliza 50 GB de espacio en disco antes de habilitar Catalog, el repositorio puede utilizar hasta 75 GB de espacio en disco después de habilitar Catalog.

Memoria para contenedores de microservicios no interactivos

La ingesta inicial se ejecuta dentro del contenedor de microservicios no interactivos. El contenedor de microservicios no interactivos es uno de los dos procesos de contenedores de microservicios de Tableau Server(El enlace se abre en una ventana nueva). De forma predeterminada, se agrega una instancia del contenedor de microservicios no interactivos a cada nodo que tenga un procesador en segundo plano proceso de servidor.

De forma predeterminada, la ingesta inicial en una única instancia del contenedor de microservicios no interactivos puede usar hasta 4 GB de memoria en el nodo del procesador en segundo plano. Si la cantidad de contenido de Tableau Server supera los 10 000, un contenedor de microservicios no interactivos puede necesitar hasta 16 GB de memoria en el nodo del procesador en segundo plano. Por lo tanto, al habilitar Catalog, asegúrese de que cada nodo del procesador en segundo plano tiene la capacidad disponible para admitir cada contenedor de microservicios no interactivos durante el proceso de ingesta inicial. Si es necesario aumentar la capacidad, debe actualizar el tamaño de la pila JVM para que los contenedores no interactivos asignen hasta 16 GB de memoria en los nodos del procesador en segundo plano. Para obtener más información, consulte noninteractivecontainer.vmopts.

Si tiene previsto agregar más contenedores de microservicios no interactivos para reducir el tiempo de ingesta inicial, primero determine cuántos contenedores totales se necesitan (mediante Paso 2: Estimar cuánto tiempo tardará la ingesta inicial) y, a continuación, compruebe si su entorno de Tableau Server está configurado con la capacidad suficiente para admitir todos los contenedores de microservicios no interactivos. En función de la configuración actual del entorno de Tableau Server, es posible que no pueda agregar todos los contenedores adicionales que no sean microservicios y que necesite para reducir el tiempo de ingesta inicial.

Prácticas recomendadas para habilitar Catalog

Dado que la velocidad de la ingesta inicial y sus requisitos son exclusivos de cada entorno de Tableau Server, Tableau recomienda que, al habilitar Catalog, realice una o varias de las siguientes acciones:

  • Asegúrese de que hay suficiente espacio en disco que el repositorio de Tableau Server pueda usar para admitir los metadatos adicionales que generará y almacenará la ingesta inicial. Como regla general, el repositorio necesitará un 50% adicional del espacio en disco que utiliza actualmente el repositorio. Para obtener más información sobre el uso del disco de Tableau Server, consulte Espacio en el disco del servidor.

  • En función de la cantidad de contenido de Tableau Server, asegúrese de que cada nodo de contenedor en segundo plano tenga al menos entre 4 y 16 GB de memoria disponible para cada instancia de un contenedor de microservicios no interactivos durante la ingesta inicial.

  • Realice el proceso durante el fin de semana para permitir que se complete la ingesta inicial antes de que los usuarios comiencen a usar las funcionalidades de Catalog.

  • Realice el proceso en un entorno de prueba con contenido de producción primero. Esto se debe a que el tipo de contenido que se debe ingerir puede desempeñar un papel importante en la velocidad de ingesta.

Resumen de los pasos para habilitar Catalog

Los pasos siguientes resumen el proceso para activar y ejecutar Catalog en Tableau Server. Los pasos deben realizarse secuencialmente.

  1. Determinar la cantidad de contenido en Tableau Server
  2. Estimar cuánto tiempo tardará la ingesta inicial
  3. Disminuir el tiempo de ingesta inicial
  4. Activar el complemento Administración de datos
  5. Desactivar las funcionalidades de Catalog
  6. Ejecutar el comando tsm maintenance metadata-services
  7. Supervisar el progreso de la ingesta inicial y validar su estado
  8. Configurar SMTP
  9. Activar las funcionalidades de Catalog

Nota: Dado que la indexación de metadatos sobre contenido de Tableau en Tableau Sever funciona con la API de metadatos, es necesario habilitar la API de metadatos para ejecutar y utilizar Catalog.

Habilitar Catalog

Paso 1: Determinar la cantidad de contenido en Tableau Server

Para determinar la cantidad de contenido en Tableau Server, haga lo siguiente:

  1. Inicie sesión en Tableau Server con sus credenciales de administrador.

  2. Vaya a la página Explorar.

  3. Haga clic en el menú desplegable Proyecto superior y agregue los números junto a Todos los libros de trabajo, Todas las métricas, Todas las fuentes de datos y Todos los flujos juntos. Esta es la cantidad total de contenido en Tableau Server.

Paso 2: calcular cuánto tiempo llevará la ingesta inicial

Para estimar el tiempo que tardará Catalog en ingerir contenido en el Tableau Server por primera vez (ingesta inicial), compare la configuración de su Tableau Server con la configuración de Tableau Server de referencia.

Para Tableau Server con la siguiente configuración, la ingestión inicial puede tardar unas 6 horas en completarse.

Componentes Valores de referencia
Contenido 17 000 libros de trabajo, métricas, fuentes de datos publicadas y flujos
Contenedor de microservicios no interactivos 10
Ingestión ~6 horas

Si tiene aproximadamente la mitad del contenido en su entorno de Tableau Server, la ingestión inicial puede tardar la mitad del tiempo en completarse.

Por ejemplo: 8500 (libros de trabajo, métricas, fuentes de datos publicadas y flujos) + 10 contenedores de microservicios no interactivos = ~ 3 horas (ingesta inicial)

Si tiene aproximadamente el doble de contenido en su entorno de Tableau Server, la ingestión inicial puede tardar el doble de tiempo en completarse.

Por ejemplo: 34 000 (libros de trabajo, métricas, fuentes de datos publicadas y flujos) + 10 contenedores de microservicios no interactivos = ~ 12 horas (ingesta inicial)

Paso 3: disminuir el tiempo de ingesta inicial

Como regla general, el tiempo que tarda Catalog en realizar la ingesta inicial está relacionado con el número de contenedores de microservicios no interactivos. Para ayudar a reducir el tiempo de ingesta inicial, puede aumentar el número de contenedores de microservicios no interactivos.

Aumente el número de contenedores de microservicios no interactivos

De forma predeterminada, se agrega un contenedor de microservicios no interactivos a cada nodo que tenga un procesador en segundo plano. Para ayudar a reducir el tiempo de ingesta inicial, Tableau recomienda aumentar el número de contenedores de microservicios no interactivos mediante el comando tsm topology set-process.

  1. Abra un símbolo del sistema como administrador en el nodo inicial (nodo en el que esté instalado TSM).

  2. Ejecute el comando tsm topology set-process --count <process_count> --node <node_ID> --process <process_name>

    Por ejemplo, para aumentar el contenedor de microservicios no interactivos en el nodo inicial a 4 contenedores, ejecute el siguiente comando:

    tsm topology set-process --count 4 –-node node1 --process noninteractive

    Para obtener más información sobre cómo ejecutar el comando y sus opciones globales, consulte tsm topology.

Importante: Antes de aumentar el número de contenedores de microservicios no interactivos, revise lo siguiente: 

  • La recomendación para aumentar los contenedores de microservicios no interactivos es para el número total de contenedores de microservicios no interactivos, no para contenedores de microservicios no interactivos totales por nodo. Por ejemplo, supongamos que tiene 4 nodos, pero desea aumentar el número de contenedores no interactivos a 8. El valor --count que se utiliza en el comando tsm es 2.

  • Para cada contenedor de microservicios no interactivo agregado, se utilizarán 4 GB de memoria adicional en el nodo y la carga se agregará al repositorio de Tableau Server (base de datos PostreSQL).

    • Tableau recomienda que aumente progresivamente el número de hilos en 2 (no más) cada vez mientras monitoriza de cerca el entorno de Tableau Server para evitar problemas con la utilización de la CPU del repositorio de Tableau Server (base de datos PostgreSQL).

    • Tenga en cuenta que cuando se añaden demasiados microservicios no interactivos, la utilización de la CPU de la base de datos PostgreSQL puede aumentar y provocar una conmutación por error. Los síntomas que se deben tner en cuenta incluyen errores de SQLException en los registros de vizportal. Para obtener más información, consulte Conmutación por error del repositorio(El enlace se abre en una ventana nueva).

Paso 4: activar Complemento de administración de datos

(Requiere el Complemento de administración de datos)

Si aún no lo ha hecho, puede activar Complemento de administración de datos. Para obtener más información, consulte Licenciar el complemento Administración de datos.

Paso 5 (opcional): Desactivar las funcionalidades de Catalog para cada sitio

(Requiere el Complemento de administración de datos)

Como parte de la activación de Complemento de administración de datos, las funcionalidades de Catalog están activadas de forma predeterminada. Debido al proceso de indexación y al tiempo estimado que se tarda en completarlo, recomendamos desactivar las funcionalidades de Catalog temporalmente para que los usuarios de Tableau Server no puedan acceder a las funcionalidades de Catalog hasta que estén listas para usarse de forma completa y eficaz.

  1. Inicie sesión en Tableau Server con sus credenciales de administrador.

  2. En el panel de navegación de la izquierda, haga clic en Configuración.

  3. En la pestaña General, en Tableau Catalog, desactive la casilla Activar Tableau Catalog.

  4. Repita los pasos del 2 al 3 para cada sitio de Tableau Server.

Paso 6: ejecutar el comando tsm maintenance metadata-services

Ejecute el comando tsm maintenance metadata-services para habilitar la API de metadatos de Tableau. Al ejecutar el comando, comienza la ingesta inicial. Si Tableau Server tiene licencia con el complemento Administración de datos, al ejecutar el comando también se activan las funcionalidades de Catalog (si no se han desactivado anteriormente).

  1. Abra un símbolo del sistema como administrador en el nodo inicial (nodo en el que esté instalado TSM).

  2. Ejecute el comando tsm maintenance metadata-services enable

    Para obtener más información sobre cómo ejecutar el comando tsm, consulte Mantenimiento de TSM(El enlace se abre en una ventana nueva).

Nota: Al ejecutar este comando, tenga en cuenta lo siguiente:

  • Este comando detiene e inicia algunos de los servicios utilizados por Tableau Server, lo que provoca que ciertas funciones, como las Recomendaciones, no estén disponibles temporalmente.

  • En este momento se crea un nuevo índice de metadatos. Al ejecutar este comando en cualquier momento posterior, se creará y reemplazará el índice anterior.

Paso 7: supervisar el progreso de la ingesta inicial y validar su estado

Al ejecutar el comando tsm anterior, se inicia el proceso de ingesta inicial. Para asegurar que la ingestión inicial se realice correctamente,  puede supervisar su avance utilizando la API de relleno. Para obtener más información, consulte Obtener el estado de ingesta inicial.

Paso 8: configurar la instalación de SMTP.

Si aún no está configurado para Tableau Server, configure la instalación de SMTP. SMTP admite el envío de correos electrónicos a los propietarios que necesitan que se pongan en contacto con ellos con respecto a los cambios en los datos. Para obtener más información sobre cómo configurar SMTP, consulte Configurar la instalación de SMTP(El enlace se abre en una ventana nueva).

Paso 9 (opcional): activar las funcionalidades de Catalog para cada sitio

(Requiere el Complemento de administración de datos)

Si desactivó las funcionalidades de Catalog, antes de habilitar Catalog en uno de los procedimientos anteriores, debe activarlo para que los usuarios puedan usar sus funcionalidades.

  1. Inicie sesión en Tableau Server con sus credenciales de administrador.

  2. En el panel de navegación de la izquierda, haga clic en Configuración.

  3. En la pestaña General, en Tableau Catalog, seleccione la casilla de verificación Activar Tableau Catalog.

  4. Repita los pasos del 2 al 3 para cada sitio de Tableau Server.

Solución de problemas de Catalog

Es posible que usted o sus usuarios encuentren uno de los siguientes problemas al usar Catalog.

Mensajes de límite de tiempo de espera y de límite de nodos excedido

Para garantizar que las tareas de Catalog que tienen que devolver un gran número de resultados no ocupen todos los recursos del sistema de Tableau Server, Catalog implementa límites de tiempo de espera y de nodos.

  • Límite de tiempo de espera

    Cuando las tareas de Catalog alcanzan el límite de tiempo de espera, usted y sus usuarios verán el siguiente mensaje:

    "Mostrando resultados parciales. Se ha excedido el límite de tiempo de espera. Vuelva a intentarlo más tarde" o TIME_LIMIT_EXCEEDED

    Para resolver este problema, como administrador de Tableau Server, puede aumentar el límite de tiempo de espera usando el comando tsm configuration set –k metadata.query.limits.time. Para obtener más información, consulte Configuración tsm(El enlace se abre en una ventana nueva) y Opciones de conjunto de configuración de tsm(El enlace se abre en una ventana nueva).

    Importante: Aumentar el límite de tiempo de espera puede utilizar más CPU durante más tiempo, lo que puede afectar al rendimiento de otros procesos en Tableau Server.

  • Límite de nodos

    Cuando las tareas de Catalog alcancen el límite de nodos, usted y sus usuarios verán el siguiente mensaje:

    NODE_LIMIT_EXCEEDED

    Para resolver este problema, como administrador de Tableau Server, puede aumentar el límite de nodos usando el comando tsm configuration set –k metadata.query.limits.count. Para obtener más información, consulte Configuración tsm(El enlace se abre en una ventana nueva) y Opciones de conjunto de configuración de tsm(El enlace se abre en una ventana nueva).

    Importante: Aumentar el límite de tiempo de espera puede afectar a la memoria del sistema.

Falta de contenido

  • Si sospecha que, después de la ingesta inicial, falta contenido de Catalog, puede usar la API de eventos para ayudar a solucionar problemas. Los eventos controlan el contenido de indexación en Tableau Server después de la ingesta inicial. Para obtener más información, consulte Obtener el estado de los eventos.

  • Cuando se elimina la conexión entre un activo externo insertado y su contenido posterior de Tableau, permanece en Catalog (o en la API de metadatos de Tableau) hasta que se elimina automáticamente mediante un proceso en segundo plano que se ejecuta todos los días a las 22:00:00 UTC (hora universal coordinada). Por ejemplo, suponga que un libro de trabajo, publicado inicialmente con un archivo de texto insertado A, se vuelve a publicar con un archivo de texto insertado B. El archivo A permanece visible (o se puede consultar) como un activo externo hasta que los procesos en segundo plano puedan eliminarlo.

    Puede desactivar la ejecución de este proceso en segundo plano si no desea eliminar este tipo de activos externos o si cree que consume recursos del sistema que no desea dedicar a este proceso. Alternativamente, puede ajustar la cantidad de activos integrados externos que se eliminan. Para obtener más información, consulte features.DeleteOrphanedEmbeddedDatabaseAsset y databaseservice.max_database_deletes_per_run.

    Puede supervisar este proceso de una de estas dos maneras:

Rendimiento después de la ingesta inicial

En algunos entornos de Tableau Server en los que el contenido específico que se actualiza con mucha frecuencia (por ejemplo, mediante programas de alta frecuencia o solicitudes de línea de comandos o API), el proceso de indexación podría sobresaturarse. En estos casos, como administrador del servidor, debería habilitar la limitación de eventos para mejorar el rendimiento de Catalog. Para obtener más información, consulte metadata.ingestor.pipeline.throttleEventsEnable.

Nota: Cuando se habilita la limitación de eventos, es posible que los usuarios observen un retraso previsto en los cambios de contenido en Catalog.

Errores de memoria insuficiente

En algunos casos, se pueden producir errores de memoria insuficiente en Tableau Server como resultado de problemas con la ingesta de contenido complejo. Si sospecha que la ingesta es la causa de errores de memoria insuficiente en Tableau Server, póngase en contacto con el equipo de soporte de Tableau para configurar que no se ingieran las metadata.ingestor.blocklist y poder resolver el problema.

Deshabilitar Catalog

Como administrador de Tableau Server, puede deshabilitar Catalog de dos maneras.

Desactivar las funcionalidades de Catalog para cada sitio

(Requiere el Complemento de administración de datos)

Puede desactivar las funcionalidades de Catalog en cualquier momento. Cuando las funcionalidades de Catalog están desactivadas, no es posible acceder a sus funciones, como la capacidad de añadir advertencias de calidad sobre los datos o administrar explícitamente los permisos de los activos de la base de datos y las tablas, desde , Tableau Server. Sin embargo, Catalog continúa indexando el contenido publicado y se puede acceder a los metadatos desde la API de metadatos de Tableau y los métodos de metadatos en la API de REST de Tableau.

  1. Inicie sesión en Tableau Server con sus credenciales de administrador.

  2. En el panel de navegación de la izquierda, haga clic en Configuración.

  3. En la pestaña General, en Tableau Catalog, desactive la casilla Activar Tableau Catalog.

Detener la indexación de metadatos en Tableau Server

Para dejar de indexar el contenido publicado en Tableau Server, puede deshabilitar la API de metadatos de Tableau. Para desactivar la API de metadatos, ejecute el comando tsm maintenance metadata-services disable. Para obtener más información, consulte tsm maintenance(El enlace se abre en una ventana nueva).

Otros artículos de esta sección

¡Gracias por sus comentarios!