Habilitar Tableau Catalog

Tableau Catalog descubre e indexa todo el contenido de su sitio de Tableau Online o Tableau Server, incluidos libros de trabajo, fuentes de datos, hojas y flujos. La indexación se utiliza para recopilar información sobre el contenido, o los metadatos, el esquema y la dependencia del contenido. Luego, a partir de los metadatos, Catalog identifica todas las bases de datos, los archivos y las tablas utilizadas por el contenido de su sitio de Tableau Online o Tableau Server.

El catálogo está disponible con Complemento de administración de datos. Para obtener más información, consulte Sobre el Complemento de administración de datos.

Además de Catalog, también se puede acceder a los metadatos sobre su contenido desde la API de metadatos de Tableau y la API de REST de Tableau Server utilizando métodos de metadatos.

Antes de habilitar Catalog

Como administrador de Tableau Server, hay algunas cosas que debe tener en cuenta para permitir que Catalog tenga un rendimiento óptimo en su entorno de Tableau Server.

Versiones necesarias

Antes de habilitar Catalog, asegúrese de que está ejecutando una de las siguientes versiones de Tableau Server para garantizar una experiencia de Catalog óptima:

  • Tableau Server 2019.3.4 o posterior
  • Tableau Server 2019.4.2 o posterior
  • Tableau Server 2020.1.0 o posterior

Para obtener más información sobre por qué estas versiones son necesarias, consulte la base de conocimientos de Tableau.

Qué esperar al habilitar Catalog

Cuando se habilita Catalog, el contenido existente de Tableau Server se indexa automáticamente.

Ingesta inicial

El proceso de indexación se compone de dos componentes principales, uno de los cuales se denomina ingesta inicial. La ingesta inicial se puede desglosar en dos componentes adicionales:

  • Relleno primario
  • Relleno secundario

El estado del relleno primario y el relleno secundario es importante a la hora de supervisar el progreso y validar que Catalog se ha habilitado correctamente y se está ejecutando en su entorno de Tableau Server.

Velocidad de ingesta inicial

El tiempo que tarda Catalog en indexar el contenido por primera vez depende de un par de factores:

  • Cantidad de contenido en Tableau Server: La cantidad de contenido se mide por el número total de libros de trabajo, fuentes de datos publicadas y flujos publicados en Tableau Server. Para obtener más información, consulte Espacio en disco para almacenar metadatos.

  • Número de contenedor de microservicios no interactivos  Catalog utiliza el contenedor de microservicios no interactivos para indexar todo el contenido en Tableau Server. Para obtener más información, consulte Memoria para contenedores de microservicios no interactivos.

Comprender los factores que afectan a la ingesta inicial puede ayudarle a medir cuánto tiempo puede tardar en habilitar y ejecutar Catalog en su entorno.

Espacio en disco para almacenar metadatos

Durante la ingesta inicial, los metadatos se generan y almacenan en el repositorio de Tableau Server ("relación" en las bases de datos PostgreSQL). La cantidad de espacio en disco necesaria para almacenar los metadatos es aproximadamente la mitad del espacio en disco utilizado actualmente por el repositorio ("grupo de trabajo" de las bases de datos PostgreSQL).

Por ejemplo, supongamos que el repositorio utiliza 50 GB de espacio en disco antes de habilitar Catalog, el repositorio puede utilizar hasta 75 GB de espacio en disco después de habilitar Catalog.

Memoria para contenedores de microservicios no interactivos

La ingesta inicial se ejecuta dentro del contenedor de microservicios no interactivos. El contenedor de microservicios no interactivos es uno de los dos procesos de contenedores de microservicios de Tableau Server. De forma predeterminada, se agrega una instancia del contenedor de microservicios no interactivos a cada nodo que tenga un procesador en segundo plano proceso de servidor.

De forma predeterminada, la ingesta inicial en una única instancia del contenedor de microservicios no interactivos puede usar hasta 4 GB de memoria en el nodo del procesador en segundo plano. Si la cantidad de contenido de Tableau Server supera los 10 000, un contenedor de microservicios no interactivos puede necesitar hasta 16 GB de memoria en el nodo del procesador en segundo plano. Por lo tanto, al habilitar Catalog, asegúrese de que cada nodo del procesador en segundo plano tiene la capacidad disponible para admitir cada contenedor de microservicios no interactivos durante el proceso de ingesta inicial. Si es necesario aumentar la capacidad, debe actualizar el tamaño de la pila JVM para que los contenedores no interactivos asignen hasta 16 GB de memoria en los nodos del procesador en segundo plano. Para obtener más información, consulte noninteractivecontainer.vmopts.

Si tiene previsto agregar más contenedores de microservicios no interactivos para reducir el tiempo de ingesta inicial, primero determine cuántos contenedores totales se necesitan (mediante Paso 2: Estimar cuánto tiempo tardará la ingesta inicial) y, a continuación, compruebe si su entorno de Tableau Server está configurado con la capacidad suficiente para admitir todos los contenedores de microservicios no interactivos. En función de la configuración actual del entorno de Tableau Server, es posible que no pueda agregar todos los contenedores adicionales que no sean microservicios y que necesite para reducir el tiempo de ingesta inicial.

Prácticas recomendadas para habilitar Catalog

Dado que la velocidad de la ingesta inicial y sus requisitos son exclusivos de cada entorno de Tableau Server, Tableau recomienda que, al habilitar Catalog, realice una o varias de las siguientes acciones:

  • Asegúrese de que hay suficiente espacio en disco que el repositorio de Tableau Server pueda usar para admitir los metadatos adicionales que generará y almacenará la ingesta inicial. Como regla general, el repositorio necesitará un 50% adicional del espacio en disco que utiliza actualmente el repositorio. Para obtener más información sobre el uso del disco de Tableau Server, consulte Espacio en el disco del servidor.

  • En función de la cantidad de contenido de Tableau Server, asegúrese de que cada nodo de contenedor en segundo plano tenga al menos entre 4 y 16 GB de memoria disponible para cada instancia de un contenedor de microservicios no interactivos durante la ingesta inicial.

  • Realice el proceso durante el fin de semana para permitir que se complete la ingesta inicial antes de que los usuarios comiencen a usar las funcionalidades de Catalog.

  • Realice el proceso en un entorno de prueba con contenido de producción primero. Esto se debe a que el tipo de contenido que se debe ingerir puede desempeñar un papel importante en la velocidad de ingesta.

Resumen de los pasos para habilitar Catalog

Los pasos siguientes resumen el proceso para activar y ejecutar Catalog en Tableau Server. Los pasos deben realizarse secuencialmente.

  1. Determinar la cantidad de contenido en Tableau Server
  2. Estimar cuánto tiempo tardará la ingesta inicial
  3. Disminuir el tiempo de ingesta inicial
  4. Activar el complemento Administración de datos
  5. Desactivar las funcionalidades de Catalog
  6. Ejecutar el comando tsm maintenance metadata-services
  7. Supervisar el progreso de la ingesta inicial y validar su estado
  8. Configurar SMTP
  9. Activar las funcionalidades de Catalog

Nota: estos pasos también se pueden utilizar para habilitar la API de metadatos de Tableau cuando Tableau Server no tiene licencia con el archivo Complemento de administración de datos.

Habilitar Catalog

Paso 1: Determinar la cantidad de contenido en Tableau Server

Para determinar la cantidad de contenido en Tableau Server, haga lo siguiente:

  1. Inicie sesión en Tableau Server con sus credenciales de administrador.

  2. Vaya a la página Explorar.

  3. Haga clic en el menú desplegable Proyecto superior y agregue los números junto a Todos los libros de trabajo, Todas las fuentes de datos y Todos los flujos juntos. Esta es la cantidad total de contenido en Tableau Server.

Paso 2: calcular cuánto tiempo llevará la ingesta inicial

Para estimar el tiempo que tardará Catalog en ingerir contenido en el Tableau Server por primera vez (ingesta inicial), compare la configuración de su Tableau Server con la configuración de Tableau Server de referencia.

Para Tableau Server con la siguiente configuración, la ingestión inicial puede tardar unas 6 horas en completarse.

Componentes Valores de referencia
Contenido 17 000 libros de trabajo, fuentes de datos publicadas y flujos
Contenedor de microservicios no interactivos 10
Ingestión ~6 horas

Si tiene aproximadamente la mitad del contenido en su entorno de Tableau Server, la ingestión inicial puede tardar la mitad del tiempo en completarse.

Por ejemplo: 8500 (libros de trabajo, fuentes de datos publicadas y flujos) + 10 contenedores de microservicios no interactivos = ~ 3 horas (ingesta inicial)

Si tiene aproximadamente el doble de contenido en su entorno de Tableau Server, la ingestión inicial puede tardar el doble de tiempo en completarse.

Por ejemplo: 34 000 (libros de trabajo, fuentes de datos publicados y flujos) + 10 contenedores de microservicios no interactivos = ~ 12 horas (ingesta inicial)

Paso 3: disminuir el tiempo de ingesta inicial

Como regla general, el tiempo que tarda Catalog en realizar la ingesta inicial está relacionado con el número de contenedores de microservicios no interactivos. Para ayudar a reducir el tiempo de ingesta inicial, puede aumentar el número de contenedores de microservicios no interactivos.

Aumente el número de contenedores de microservicios no interactivos

De forma predeterminada, se agrega un contenedor de microservicios no interactivos a cada nodo que tenga un procesador en segundo plano. Para ayudar a reducir el tiempo de ingesta inicial, Tableau recomienda aumentar el número de contenedores de microservicios no interactivos mediante el comando tsm topology set-process.

  1. Abra un símbolo del sistema como administrador en el nodo inicial (nodo en el que esté instalado TSM).

  2. Ejecute el comando tsm topology set-process –-count <process_count> --<node_ID> --process <process_name>

    Por ejemplo, para aumentar el contenedor de microservicios no interactivos en el nodo inicial a 4 contenedores, ejecute el siguiente comando:

    tsm topology set-process –-count 4 –-n node1 --process noninteractive

    Para obtener más información sobre cómo ejecutar el comando y sus opciones globales, consulte tsm topology.

Importante: antes de aumentar el número de contenedores de microservicios no interactivos, revise lo siguiente: 

  • La recomendación para aumentar los contenedores de microservicios no interactivos es para el número total de contenedores de microservicios no interactivos, no para contenedores de microservicios no interactivos totales por nodo. Por ejemplo, supongamos que tiene 4 nodos, pero desea aumentar el número de contenedores no interactivos a 8. El valor --count que se utiliza en el comando tsm es 2.

  • Para cada contenedor de microservicios no interactivo agregado, se utilizarán 4 GB de memoria adicional en el nodo y la carga se agregará al repositorio de Tableau Server (base de datos PostreSQL).

    • Tableau recomienda que aumente progresivamente el número de hilos en 2 (no más) cada vez mientras monitoriza de cerca el entorno de Tableau Server para evitar problemas con la utilización de la CPU del repositorio de Tableau Server (base de datos PostgreSQL).

    • Tenga en cuenta que cuando se añaden demasiados microservicios no interactivos, la utilización de la CPU de la base de datos PostgreSQL puede aumentar y provocar una conmutación por error. Los síntomas que se deben tner en cuenta incluyen errores de SQLException en los registros de vizportal. Para obtener más información, consulte Conmutación por error del repositorio.

Paso 4: activar Complemento de administración de datos

(Requiere el Complemento de administración de datos)

Si aún no lo ha hecho, puede activar Complemento de administración de datos. Para obtener más información, consulte Licenciar el complemento Administración de datos.

Paso 5 (opcional): Desactivar las funcionalidades de Catalog para cada sitio

(Requiere el Complemento de administración de datos)

Como parte de la activación de Complemento de administración de datos, las funcionalidades de Catalog están activadas de forma predeterminada. Debido al proceso de indexación y al tiempo estimado que se tarda en completarlo, recomendamos desactivar las funcionalidades de Catalog temporalmente para que los usuarios de Tableau Server no puedan acceder a las funcionalidades de Catalog hasta que estén listas para usarse de forma completa y eficaz.

  1. Inicie sesión en Tableau Server con sus credenciales de administrador.

  2. En el panel de navegación de la izquierda, haga clic en Configuración.

  3. En la pestaña General, en Tableau Catalog, desactive la casilla Activar Tableau Catalog.

  4. Repita los pasos del 2 al 3 para cada sitio de Tableau Server.

Paso 6: ejecutar el comando tsm maintenance metadata-services

Ejecute el comando tsm maintenance metadata-services para habilitar la API de metadatos de Tableau. Al ejecutar el comando, comienza la ingesta inicial. Si Tableau Server tiene licencia con el complemento Administración de datos, al ejecutar el comando también se activan las funcionalidades de Catalog (si no se han desactivado anteriormente).

  1. Abra un símbolo del sistema como administrador en el nodo inicial (nodo en el que esté instalado TSM).

  2. Ejecute el comando tsm maintenance metadata-services enable

    Para obtener más información sobre cómo ejecutar el comando tsm, consulte Mantenimiento de TSM.

Nota: Al ejecutar este comando, tenga en cuenta lo siguiente:

  • Este comando detiene e inicia algunos de los servicios utilizados por Tableau Server, lo que provoca que ciertas funciones, como las Recomendaciones, no estén disponibles temporalmente.

  • En este momento se crea un nuevo índice de metadatos. Al ejecutar este comando en cualquier momento posterior, se creará y reemplazará el índice anterior.

Paso 7: supervisar el progreso de la ingesta inicial y validar su estado

Al ejecutar el comando tsm anterior, se inicia el proceso de ingesta inicial. Para asegurar que la ingesta inicial se realice correctamente,  puede supervisar su avance a través de Tableau Server utilizando el conjunto de procedimientos que se indican a continuación y compruebe que Catalog (y la API de metadatos) funcionan correctamente.

Nota: la supervisión de la ingesta inicial y la validación de su estado solo se pueden realizar mediante el contenedor de microservicios no interactivos en el nodo "líder". Para obtener más información, puede revisar el procedimiento en el paso C.

A. Obtenga los nodos y los números de puerto para cada instancia del contenedor de microservicios no interactivos

  1. Abra un símbolo del sistema como administrador en el nodo inicial (donde está instalado TSM) en el clúster.

  2. Ejecute el siguiente comando para obtener el número de puerto del contenedor de microservicios no interactivos: tsm topology list-ports

    No cierre la ventana del símbolo del sistema.

  3. En los resultados, busque todas las instancias de noninteractive:primary y tome nota de los nodos y sus números de puerto. Utilizará estos valores de nodo en el paso B y estos números de puerto en los pasos D y E.

B. Obtenga el nombre del equipo (dirección) para cada nodo con un contenedor de microservicios no interactivos

  1. Con el símbolo del sistema, ejecute el siguiente comando para enumerar todos los nombres de equipo (direcciones) de todos los nodos: tsm topology list-nodes -v

  2. Anote todos los valores de dirección que corresponden a los nodos que anotó al final del paso A. Utilizará estos valores de dirección en el paso D.

C. Obtener cookies de autenticación del navegador

  1. Abra un navegador como Google Chrome.

  2. Inicie sesión en Tableau Server con sus credenciales de administrador.

  3. Utilizando la opción Herramientas del desarrollador (o algo similar), vaya a la sección Cookies y tome nota de los valores para seguir las cookies:

    • XSRF-TOKEN

    • workgroup_session_id

    No cierre la ventana del navegador.

D. Recuperar el estado de la ingesta para el relleno primario en el nodo "líder"

  1. Usando la misma ventana del navegador en el Paso C, copie la siguiente URI y péguela en la barra de direcciones del navegador:

    http://<your-server>:<port>/relationship-service-war/control/backfill/status

  2. En la URI, haga lo siguiente: 

    • Reemplace <your-server> con una de las direcciones que anotó en el paso B.

    • Reemplace <port> por el número de puerto correspondiente de la dirección que anotó en el paso A.

    Por ejemplo, http://10.100.0.0:8345/relationship-service-war/control/backfill/status

  3. Aplique una de las siguientes opciones: 

    • Si el punto de conexión del paso 2 devuelve "Este host no es el líder. La operación de solicitud solo se puede realizar en la instancia de Líder", repita el paso 2 con una dirección diferente y su número de puerto correspondiente que anotó al final del paso A.

      o

    • Si el punto de conexión del paso 2 devuelve un valor true o false, ha identificado el nodo "líder" y puede continuar con el paso D.

    No cierre la ventana del navegador.

Nota: también puede recuperar el estado de la ingesta para el relleno primario usando Postman formando una petición HTTP GET usando la URI de arriba y las siguientes claves requeridas en el encabezado de la petición:

Clave Valor
Cookie XSRF-TOKEN=<cookie-value>; workgroup_session_id=<cookie-value>
Tipo de contenido application/json

E. Recuperar el estado de la ingesta para el relleno secundario

  1. Usando la misma ventana del navegador en el paso D, copie la siguiente URI y péguela en la barra de direcciones del navegador:

    http://<your-server>:<port>/relationship-service-war/control/secondaryIndexing/shortcutBackfillComplete

  2. Realice estas acciones con la URI:

    • Reemplace <your-server> con la dirección del nodo "líder" del final del paso D.
    • Reemplace <port> con el número de puerto del nodo "líder" del final del paso D.

      Por ejemplo: http://10.100.0.0:8345/relationship-service-war/control/secondaryIndexing/shortcutBackfillComplete

Nota: también puede recuperar el estado de la ingesta para el relleno secundario usando Postman formando una petición HTTP GET usando la URI de arriba y las siguientes claves requeridas en el encabezado de la petición:

Clave Valor
Cookie XSRF-TOKEN=<cookie-value>; workgroup_session_id=<cookie-value>
Tipo de contenido application/json

F. Revisar los resultados para determinar el estado de la ingesta

El punto de conexión del paso C (Relleno primario) anterior devuelve una nota de JSON que indica el estado de la ingesta por contenido y tipo de recurso. Revise los resultados y tenga en cuenta lo siguiente:

  • Un estado backfillComplete con el valor true indica que el relleno primario se ha completado
  • Un estado backfillComplete con el valor false indica que la ingesta no se ha completado todavía

Por ejemplo:

[
{"type":"PublishedDatasource","currentId":{"contentId":null,"pageToken":null},"processedCount":0,"durationSeconds":0,"backfillComplete":true},
{"type":"Database","currentId":{"contentId":null,"pageToken":null},"processedCount":0,"durationSeconds":0,"backfillComplete":true},
{"type":"DatabaseTable","currentId":{"contentId":null,"pageToken":null},"processedCount":0,"durationSeconds":0,"backfillComplete":true},
{"type":"Workbook","currentId":{"contentId":null,"pageToken":null},"processedCount":0,"durationSeconds":0,"backfillComplete":true},
{"type":"Flow","currentId":{"contentId":null,"pageToken":null},"processedCount":0,"durationSeconds":0,"backfillComplete":true}
]

El punto de conexión del paso D (relleno secundario) anterior devuelve una notificación de estado JSON con un valor true o false.

  • Un estado true indica que el relleno secundario está completo

  • Un estado false indica que el relleno secundario no se ha completado todavía

G. Confirme que la ingesta inicial está completa

Cuando vea los valores true de ambos extremos en el paso F, la ingesta inicial se ha completado.

Paso 8: configurar la instalación de SMTP.

Si aún no está configurado para Tableau Server, configure la instalación de SMTP. SMTP admite el envío de correos electrónicos a los propietarios que necesitan que se pongan en contacto con ellos con respecto a los cambios en los datos. Para obtener más información sobre cómo configurar SMTP, consulte Configurar la instalación de SMTP.

Paso 9 (opcional): activar las funcionalidades de Catalog

(Requiere el Complemento de administración de datos)

Si desactivó las funcionalidades de Catalog, antes de habilitar Catalog en uno de los procedimientos anteriores, debe activarlo para que los usuarios puedan usar sus funcionalidades.

  1. Inicie sesión en Tableau Server con sus credenciales de administrador.

  2. En el panel de navegación de la izquierda, haga clic en Configuración.

  3. En la pestaña General, en Tableau Catalog, desactive la casilla Activar Tableau Catalog.

Solución de problemas de Catalog

Es posible que usted o sus usuarios encuentren uno de los siguientes problemas al usar Catalog (o la API de metadatos de Tableau).

Mensajes de límite de tiempo de espera y de límite de nodos excedido

Para garantizar que las tareas de Catalog o las consultas de la API de metadatos que tienen que devolver un gran número de resultados no ocupen todos los recursos del sistema de Tableau Server, Catalog implementa límites de tiempo de espera y de nodos.

  • Límite de tiempo de espera

    Cuando las tareas de Catalog o las consultas en la API de metadatos alcanzan el límite de tiempo de espera, usted y sus usuarios verán el siguiente mensaje:

    "Mostrando resultados parciales. Se ha excedido el límite de tiempo de espera. Vuelva a intentarlo más tarde" o TIME_LIMIT_EXCEEDED

    Para resolver este problema, como administrador de Tableau Server, puede aumentar el límite de tiempo de espera usando el comando tsm configuration set –k metadata.query.limits.time. Para obtener más información, consulte Configuración tsm y Opciones de conjunto de configuración de tsm.

    Importante: Aumentar el límite de tiempo de espera puede utilizar más CPU durante más tiempo, lo que puede afectar al rendimiento de otros procesos en Tableau Server.

  • Límite de nodos

    Cuando las tareas de Catalog o las consultas de la API de metadatos alcancen el límite de nodos, usted y sus usuarios verán el siguiente mensaje:

    NODE_LIMIT_EXCEEDED

    Para resolver este problema, como administrador de Tableau Server, puede aumentar el límite de nodos usando el comando tsm configuration set –k metadata.query.limits.count. Para obtener más información, consulte Configuración tsm y Opciones de conjunto de configuración de tsm.

    Importante: Aumentar el límite de tiempo de espera puede afectar a la memoria del sistema.

Deshabilitar Catalog

Como administrador de Tableau Server, puede deshabilitar Catalog de dos maneras.

Desactivar las funcionalidades de Catalog para cada sitio

(Requiere el Complemento de administración de datos)

Puede desactivar las funcionalidades de Catalog en cualquier momento. Cuando las funcionalidades de Catalog están desactivadas, no es posible acceder a sus funciones, como la capacidad de añadir advertencias de calidad sobre los datos o administrar explícitamente los permisos de los activos de la base de datos y las tablas, desde , Tableau Server (o la API de metadatos de Tableau). Sin embargo, Catalog continúa indexando el contenido publicado y se puede acceder a los metadatos desde la API de metadatos de Tableau y los métodos de metadatos en la API de REST de Tableau Server.

  1. Inicie sesión en Tableau Server con sus credenciales de administrador.

  2. En el panel de navegación de la izquierda, haga clic en Configuración.

  3. En la pestaña General, en Tableau Catalog, desactive la casilla Activar Tableau Catalog.

Detener la indexación de metadatos en Tableau Server

Para dejar de indexar el contenido publicado en Tableau Server, puede deshabilitar la API de metadatos de Tableau. Para desactivar la API de metadatos, ejecute el comando tsm maintenance metadata-services disable. Para obtener más información, consulte tsm maintenance.

¡Gracias por sus comentarios! Se produjo un error al enviar sus comentarios. Vuelva a intentarlo o escríbanos.