Gestión de la carga de trabajo mediante roles de nodo

Mediante el uso de roles de nodo puede configurar dónde se procesan ciertos tipos de cargas de trabajo en la instalación de Tableau Server. Las funcionalidades de los roles de nodo le permiten escalar y dedicar los recursos a cargas de trabajo específicas. Puede configurar roles de nodo para el procesador en segundo plano y el almacén de datos.

El rol del nodo del procesador en segundo plano especifica el tipo de tareas en segundo plano que deben ejecutarse en un nodo, mientras que el rol del nodo Almacén de archivos especifica el tipo de carga de trabajo de extracción que debe ejecutarse en un nodo. Ambos roles de nodo se especifican a nivel de nodo. Aunque estos roles de nodo pueden funcionar de forma independiente para optimizar la carga de trabajo seleccionada, los dos roles de nodo en combinación se pueden utilizar para especializar los nodos de servidor para ejecutar preferentemente cargas de trabajo seleccionadas para optimizar el rendimiento y extraer cargas de trabajo pesadas. Esta combinación se analiza con más detalle más adelante en la sección Roles de nodo del almacén de archivos

Roles de nodos del procesador en segundo plano

El proceso del procesador en segundo plano ejecuta tareas de Tableau Server, como actualizaciones de extracciones, suscripciones, tareas de flujos, tareas "Ejecutar ahora" y tareas iniciadas desde tabcmd. La ejecución de todas estas tareas puede requerir muchos recursos del equipo. Si tiene más de un nodo Procesador en segundo plano en el clúster, puede administrar la carga de trabajo que recibe especificando el tipo de tareas que puede ejecutar en un nodo. Para ello, utilice la funcionalidad del rol de nodo procesador en segundo plano.

Actualmente, esta opción de configuración está disponible solo a través de los comandos TSM CLI y solo es útil en clústeres de varios nodos. Si tiene un único nodo, el procesador en segundo plano está configurado para ejecutar todas las tareas de forma predeterminada y eso no se puede cambiar.

Uso de roles de nodos del procesador en segundo plano

La funcionalidad del rol de nodo Procesador en segundo plano está pensada para darle más control y gobierno sobre dónde se procesan determinados tipos de carga de trabajo en la instalación de Tableau Server, y permite escalar y dedicar recursos a cargas de trabajo específicas.

Por ejemplo, si en su implementación hay muchas extracciones y los usuarios ejecutan muchas actualizaciones de extracción o trabajos cifrados, puede ser conveniente dedicar un nodo a las actualizaciones de extracción. Del mismo modo, si su instalación de Tableau Server procesa muchas suscripciones y desea asegurarse de que otros trabajos no detraigan recursos de las mismas, puede dedicar un nodo a las suscripciones. En estos casos, también es conveniente dedicar otros nodos Procesador en segundo plano a cargas de trabajo que no sean actualizaciones de extracción o suscripciones.

Si desea contar con alta disponibilidad, Tableau recomienda disponer de varios nodos dedicados a cargas de trabajo específicas. Por ejemplo, si dedica un nodo a las actualizaciones de extracción, debería configurar un segundo que procese estas cargas de trabajo. De esta forma, si un nodo dedicado a las actualizaciones de extracción no está disponible, podrá procesarlas el otro nodo.

Opciones de configuración

ConfiguraciónTrabajos
all-jobs (predeterminado)Todos los trabajos de Tableau Server
flowsTrabajos de ejecución de flujos.
no-flowsTodos los trabajos excepto los flujos.
extract-refreshes

Trabajos creados para:

actualizaciones incrementales y las completas, así como el cifrado y el descifrado de todas las extracciones, incluidas las creadas como resultado de flujos.

subscriptionsTrabajos de suscripción
systemTrabajos de mantenimiento del sistema que interactúan con otros procesos de Tableau Server. Por ejemplo, limpiar trabajos bloqueados, recolectar eventos de la base de datos y sincronizar Active Directory.
extract-refreshes-and-subscriptionsActualizaciones de extracción, el cifrado y el descifrado de todas las extracciones, incluidas las generadas como resultado de flujos, y trabajos de suscripción.
no-extract-refreshesTodos los trabajos excepto los de actualización de extracción y los cifrados y descifrados de todas las extracciones, incluidas las extracciones generadas como resultado de flujos.
no-subscriptionsTodos los trabajos excepto las suscripciones.
no-extract-refreshes-and-subscriptionsTodos los trabajos excepto las actualizaciones de extracción, el cifrado y el descifrado de todas las extracciones, incluidas las generadas como resultado de flujos, y los trabajos de suscripción.
no-systemTodos los trabajos excepto los trabajos de mantenimiento del sistema.

Para obtener más información sobre cómo se usan los comandos tsm para establecer roles de nodo, consulte la tsm topology.

Nota: La realización de ajustes en los roles de nodo requiere un reinicio del servidor y un tiempo de inactividad. Para obtener más información, consulte tsm pending-changes.

Requisitos de licencia

Para configurar un nodo de modo que realice un tipo específico de tareas, como flujos, actualizaciones de extracción o suscripciones, debe tener una de las siguientes licencias activadas en Tableau Server:

  • Para configurar un nodo de modo que ejecute flujos, debe tener una licencia válida de Data Management activada en su servidor y tener Tableau Prep Conductor en ejecución en ese nodo. Para obtener más información acerca de Tableau Prep Conductor, consulte Tableau Prep Conductor.

  • Para configurar un nodo de modo que ejecute actualizaciones de extracción, suscripciones y cualquier combinación relacionada con ambas tareas, debe tener una licencia válida de Advanced Management activada en Tableau Server. Si la licencia caduca o se desactiva, verá un error cada vez que haga un cambio en la configuración del servidor. Para obtener más información sobre Advanced Management, consulte Acerca de Tableau Advanced Management en Tableau Server.

¡Importante!
Si bien los flujos, las actualizaciones de extracción y las suscripciones pueden ser caras y requerir muchos recursos, no son las únicas tareas que pueden precisar de recursos dedicados. En el grupo todos los trabajos hay distintos trabajos del sistema de los que se encarga el procesador en segundo plano, como la generación de miniaturas para libros de trabajo. Asegúrese de que los nodos que ejecutan trabajos distintos de los de actualizaciones de extracción, suscripciones o flujos tengan suficientes recursos.

Para obtener más información sobre la configuración de roles de nodo mediante los comandos TSM, consulte la tsm topology set-node-role.

Consideraciones

A continuación se enumeran algunas reglas a tener en cuenta al configurar los roles de nodos Procesador en segundo plano:

  • Un nodo puede tener configurado un único rol de nodo al mismo tiempo. No se pueden configurar varios roles de nodo en un nodo.

  • Para configurar un rol de nodo, el nodo debe contar con al menos un proceso del procesador en segundo plano.

  • Si tiene un solo nodo Procesador en segundo plano, debe configurarlo para que ejecute todos los trabajos. Esta es la configuración predeterminada y no requiere de licencias adicionales.

  • Si tiene más de un nodo de este tipo, deberá configurarlos de modo que, entre todos, se encarguen de todos los trabajos. Puede lograrse de las siguientes maneras:

    • Configure uno de los nodos para que ejecute todos los trabajos mediante la opción Todos los trabajos. Es el sistema más fácil y directo.

    • Utilice una de las configuraciones de excepción en uno de los nodos:

      • no-flows
      • no-subscriptions
      • no-extract-refreshes
      • no-extract-refreshes-and-subscriptions

Por ejemplo, en un clúster donde haya tres procesadores en segundo plano, puede configurar uno para que ejecute los flujos, otro para que se ocupe de las suscripciones y las actualizaciones de extracción, y otro para que se encargue de todos los trabajos excepto los flujos, las suscripciones y las actualizaciones de extracción.

Nota: La capacidad de especificar que los roles de nodo ejecuten flujos, o todos los trabajos excepto los flujos, o todos los trabajos, se introdujo en 2019.1.

Roles de nodo del almacén de archivos

El Almacén de archivos de Tableau Server controla el almacenamiento de las extracciones. Existen tres grandes categorías de cargas de trabajo que dependen de la extracción.

Carga de trabajo de la extracciónServicio de ejecución
ActualizarProcesador en segundo plano
ConsultaMotor de datos
Copia de seguridad/RestauraciónCopia de seguridad/Restauración

La gestión de roles de nodo del almacén de archivos en combinación con la gestión de roles de nodos del procesador en segundo plano ofrece a los administradores de servidores la capacidad de especializar los nodos de servidor para ejecutar de forma preferente cargas de trabajo seleccionadas a fin de optimizar el rendimiento de todas las categorías de cargas de trabajo de extracción más pesadas.

Es posible especializar un nodo para ejecutar cargas de trabajo de consulta de extracciones a través de una topología que solo tiene nodos independientes de motor de datos. Para obtener más información, consulte Optimizar para entornos con gran volumen de consultas de extracción. Sin embargo, esto es a expensas de las cargas de trabajo de actualización de extracciones, que se ejecutan con los nodos de procesador en segundo plano. Con el enfoque de aislamiento basado en topología, las cargas de trabajo de actualización de extracciones en el procesador en segundo plano pueden ser más lentas, ya que ninguno de los nodos de este procesador tiene un Almacén de archivos y, por lo tanto, todo el tráfico de actualización de las extracciones pasa por la red.

Con la opción Roles de nodo del almacén de archivos, es posible designar ciertos nodos de servidor que procesan las consultas de extracción para que se seleccionen preferentemente de la lista de nodos de servidor que pueden hacerlo. Esto ayuda a acelerar las cargas de trabajo, como las de copia de seguridad y actualización de extracciones, ya que permite a los administradores del servidor habilitar el Almacén de archivos en los nodos del servidor del procesador en segundo plano, lo que evita que las consultas de extracción se ejecuten en estos nodos. Esta función es útil si tiene una carga de trabajo de consultas y de actualizaciones con muchas extracciones y desea conseguir un rendimiento óptimo de las consultas de extracción.

Instrucciones para optimizar las cargas de trabajo de actualización de la extracción y de copia de seguridad/restauración

Empiece desde una topología con nodos especializados de motor de datos (consulte Optimizar para entornos con gran volumen de consultas de extracción).

Nota: En el diagrama y el procedimiento que aparecen a continuación, el nodo 1 es el primer nodo, el nodo 2 es el nodo adicional 1, el nodo 3 es el nodo adicional 2 y el nodo 4 es el nodo adicional 3.

Topología 1: Nodos de motor de datos dedicadosTopología 1: Nodos de motor de datos dedicados

  1. Agregue el almacén de archivos al Nodo 1.
    tsm topology set-process -n node1 -pr filestore -c 1
  2. Designe el nodo 3 y el nodo 4 para ejecutar preferentemente cargas de trabajo de consulta de extracciones.
    tsm topology set-node-role -n node3, node4 -r extract-queries
  3. Designe el nodo 1 para ejecutar preferentemente cargas de trabajo de actualizaciones de extracciones.
    tsm topology set-node-role -n node1 -r extract-refreshes
  4. Designe el nodo 2 para ejecutar preferentemente cargas de trabajo que no sean de actualizaciones de extracciones.
    tsm topology set-node-role -n node2 -r no-extract-refreshes
  5. Aplique los cambios pendientes.
    tsm pending-changes apply

Topología 2Topología 2: Nodo de almacén de archivos extra

Nota: En la implementación de Tableau Server, agregar funciones del Almacén de archivos a los nodos existentes aumentará temporalmente la red I/O entre todos los nodos del Almacén de archivos mientras se sincroniza el nuevo Almacén de archivos. La duración de esta operación depende del volumen de datos en el Almacén de Archivos y de la capacidad de ancho de banda de la red. El estado de la sincronización se puede supervisar usando la interfaz del usuario web de TSM. Si agrega más de un Almacén de archivos a su implementación, se recomienda agregarlos consecutivamente y esperar a que se complete la sincronización inicial entre cada adición.

Ajuste detallado de la administración de la carga de trabajo de consultas de extracción

Cuando se ejecutan consultas de extracción para suscripciones de correo electrónico y alertas de métricas, al mismo tiempo que los usuarios ven interactivamente visualizaciones basadas en extracciones, los usuarios pueden experimentar tiempos de carga de visualización más lentos que los normales. Utilice las siguientes funciones de nodo para ajustar cómo se priorizan estas cargas de trabajo.

Función de nodoTipo de carga de trabajo de consulta de extracciónEjemplo
extract-queriesprogramadasuscripciones de correo electrónico y alertas de métricas
extract-queries-interactiveinteractiveusuarios que ven una visualización basada en extracciones

Si la implementación del servidor está experimentando un crecimiento en las suscripciones de correo electrónico y las alertas de métricas, puede agregar nodos y asignar la función de nodo extract-queries, lo que les permite controlar mejor las suscripciones y alertas.

Si la implementación del servidor está experimentando un crecimiento en los usuarios que ven visualizaciones basadas en extraccopmes, puede agregar nodos y asignar la función de nodo extract-queries-interactive, lo que los hace priorizar las consultas de extracción interactivas para reducir los tiempos de carga de visualización basadas en extracciones. La función de nodo extract-queries-interactive es una preferencia y no un aislamiento estricto. Esto significa que las consultas se enrutarán a los nodos que tienen asignada la función extract-queries-interactive. Si tiene varios nodos con la función extract-queries-interactive, las consultas se enrutarán en función del estado del nodo.

Por ejemplo, agregue un nodo y asígnelo para ejecutar cargas de trabajo extract-queries-interactive preferentemente.

  • tsm topology set-node-role -n node4 -r extract-queries-interactive

Opciones de configuración

ConfiguraciónTrabajos
all-jobs (predeterminado)Todos los trabajos de Tableau Server
extract-queriesTrabajos que se crean para consultas de extracción. Los nodos seleccionados se ejecutarán como todos los trabajos y priorizarán el procesamiento de las consultas de extracción.
extract-queries-interactiveTrabajos que se crean para consultas de extracción. Los nodos seleccionados se ejecutarán como todos los trabajos y priorizarán el procesamiento de consultas de extracción interactivas, como las que se ejecutan cuando un usuario está mirando su pantalla y esperando a que se cargue un dashboard basado en extractos. Se trata de una configuración avanzada y solo se debe usar si el clúster tiene una carga de trabajo de suscripción y alerta pesada que hace que los usuarios experimenten un rendimiento más lento en tiempos de carga de visualización que se ejecutan al mismo tiempo que las cargas programadas.

Para obtener más información sobre la configuración de roles de nodo mediante los comandos TSM, consulte la tsm topology set-node-role.

Requisitos de licencia

Para configurar un nodo para ejecutar consultas de extracción debe tener una licencia de Advanced Management válida activada en su Tableau Server.

Ver los roles de los nodos

Utilice el siguiente comando para ver qué roles de nodo están configurados actualmente en Tableau Server:
tsm topology list-nodes -v

¿Quién puede hacer esto?

Los administradores de Tableau Server pueden configurar roles de nodo y activar las claves de producto necesarias.

¡Gracias por sus comentarios!Sus comentarios se han enviado correctamente. ¡Gracias!