Plataforma de hardware

Este contenido es parte de Tableau Blueprint, un marco de madurez que le permite ampliar y mejorar la forma en que su organización utiliza los datos para generar impacto. Para comenzar su recorrido, complete nuestra evaluación(El enlace se abre en una ventana nueva).

Nota: Este tema solo es aplicable a Tableau Server.

Es posible instalar Tableau Server en las instalaciones físicas con máquinas físicas o virtuales o en la nube. Además, es compatible con los sistemas operativos Windows o Linux. Para determinar qué plataforma de hardware usará y su tamaño, considere estas variables: el entorno, las fuentes de datos y la administración para proporcionar un acceso a los datos de autoservicio, la posible carga de trabajo de todos los usuarios y los datos de uso reales. Si es la primera vez que implementa Tableau Server, debe centrarse en los estándares del entorno y las fuentes de datos. Para las implementaciones existentes, podrá analizar los datos de Tableau Server para evaluar la carga de trabajo y el uso, además del entorno y las fuentes de datos.

Requisitos de hardware

Independientemente de dónde decida implementar Tableau Server, contar con un hardware del tamaño adecuado es fundamental. El planeamiento debe estar alineado con las necesidades cambiantes del negocio. Debe evaluar el uso del servidor y la participación de los usuarios, adaptar la implementación y modificar la topología con mayor frecuencia que con otras aplicaciones de software. Explore el enlace correspondiente a la plataforma de hardware que se ajuste a los estándares de su empresa:

  • Tipo y tamaño de la máquina virtual de Google Compute Engine (Windows | Linux)
  • Tipo y tamaño de la máquina virtual de Microsoft Azure (Windows | Linux)
  • Tipo y tamaño de la instancia del ECS de Alibaba Cloud (Windows | Linux)

Si implementa Tableau Server en la nube, el uso de hardware exclusivo y la asignación estática de RAM elimina el rendimiento variado ocasionado por la contención de recursos. Si el costo es un aspecto que debe tener en cuenta, el hardware virtual es una alternativa viable. Recomendamos que pruebe su infraestructura para encontrar la configuración que mejor se adapte a sus necesidades. Para explorar un ejemplo de cómo realizar estas pruebas, consulte el informe Tableau at the Speed of EC2 (Tableau a la velocidad de EC2). Esta prueba se realizó en AWS, pero la teoría puede aplicarse a cualquier proveedor de la nube.

Tamaño inicial de la implementación

El equipo de su cuenta de Tableau está a su disposición para evaluar los requisitos y ayudarlo a identificar el tamaño adecuado. En una implementación inicial de Tableau, debe estimar entre 600 y 800 licencias Explorer por nodo de 8 núcleos, suponiendo que haya un 10 % de usuarios activos. Estos representan las solicitudes interactivas simultáneas en Tableau Server, incluido el consumo de dashboards desde equipos portátiles o dispositivos móviles, la creación web, la conexión a fuentes de datos publicadas y las consultas realizadas en ellas. Este es solo un punto de partida y no debe considerarse como una regla de tamaño más allá de la implementación inicial. La memoria debe ser de al menos 8 GB de RAM por núcleo para un servidor de producción. Para clústeres con menos de 40 núcleos, use nodos de 8 núcleos y, en clústeres con más de 40 núcleos, use nodos de 16 núcleos. La carga de trabajo relativa de cada tipo de licencia se debe considerar al determinar el tamaño del hardware. Debe suponer que un Explorer representa 1 usuario y un Creator tiene una carga de trabajo relativa equivalente a 2,4 usuarios, mientras que un Viewer tiene una carga de trabajo relativa de 0,75 de un usuario. Con estos coeficientes de carga de trabajo, puede estimar la capacidad del clúster. En la siguiente tabla se muestran ejemplos de cargas de trabajo equivalentes en cada fila:

 

Creators

Explorers

Viewers

Carga de trabajo 1

25

300

586

Carga de trabajo 2

50

333

462

Carga de trabajo 3

75

234

514

Carga de trabajo 4

100

171

518

 

La carga de trabajo real de los usuarios con licencias Creator, Explorer y Viewer puede variar según el uso de las funcionalidades de Tableau Server, como la frecuencia de conexión a los datos y la creación web, así como la visualización del contenido y la interacción con él. A medida que se incorporan los usuarios y comienzan a crear y consumir contenido, debe supervisar el uso del hardware y el contenido. De esta manera, podrá tomar decisiones informadas sobre el tamaño del servidor basándose en datos obtenidos de las herramientas de supervisión del hardware y el repositorio de Tableau Server. Para obtener más información, consulte Supervisión de Tableau y Medición de la interacción y la adopción de los usuarios de Tableau.

Escalabilidad

Tanto en implementaciones nuevas como existentes, el objetivo es mantener de forma proactiva suficiente disponibilidad, capacidad y espacio libre y minimizar la contención de recursos. Al igual que otras plataformas empresariales, Tableau Server se escala de manera vertical agregando procesadores, memoria y disco, o de manera horizontal con el aumento de nodos de un clúster. Tableau Server se adapta de manera prácticamente lineal al agregar recursos de hardware, de acuerdo con su combinación específica de entornos, datos, cargas de trabajo y usos. Debe realizar pruebas de carga y planear la capacidad regularmente, según se indica en Mantenimiento de Tableau.

La escalabilidad y el rendimiento dependen en gran medida de los sistemas externos, como las fuentes de datos, el volumen de datos y la velocidad de la red, las cargas de trabajo de los usuarios y el diseño del libro de trabajo. Todos estos aspectos pueden cambiar rápidamente a medida que avanzan las implementaciones. En una implementación inicial con una configuración de hardware del tamaño correcto, ciertos factores pueden tener un gran impacto en el rendimiento del servidor y la experiencia del usuario. Estos incluyen, por ejemplo, la incorporación no planeada de usuarios, el uso sin supervisión, los libros de trabajo de baja calidad, un diseño de las extracciones de datos deficiente y programas de actualización durante las horas pico. Como resultado acumulado de estos incidentes aislados, el rendimiento empeora. Para obtener más información, consulte el informe sobre escalabilidad de Tableau Server.

Al implementar Tableau Server en la nube, puede aprovechar todas las capacidades de adaptación existentes de la plataforma de Tableau, incluida la topología dinámica. Con un simple reinicio del servidor, también puede cambiar las máquinas subyacentes que respaldan la plataforma, siempre que su dirección IP pública no se modifique.

Para implementaciones de un único nodo, también puede apagar las máquinas de Tableau Server durante el tiempo de inactividad a fin de reducir los costos de las máquinas. Hacerlo con un clúster de múltiples nodos pondrá a Tableau en un estado degradado. Sin embargo, puede usar la topología dinámica para adecuar la asignación de procesos de Tableau Server de manera flexible. Esto le permitirá optimizar el equilibrio de los costos de la máquina y las necesidades de capacidad. La funcionalidad de adaptación automática que finaliza las tareas de las máquinas o las inicia en función de la demanda no es compatible.

Entornos de servidor

Además del entorno de producción, Tableau recomienda contar con un entorno de prueba a fin de comprobar las actualizaciones y los cambios en la topología del servidor. El entorno de producción será compatible con el análisis moderno, mediante proyectos de producción y en entornos aislados, con validación, promoción y certificación de contenido. Todo en un único entorno. Para obtener más información sobre estos tres procesos de administración de contenido, consulte Gobernanza de Tableau. Los entornos de producción y de prueba deben tener especificaciones de hardware, topologías del servidor y configuraciones idénticas. Esto permitirá a los administradores probar actualizaciones y participar en programas beta en el entorno de prueba al restaurar el contenido de producción.

Algunas organizaciones tienen políticas de TI que requieren tres entornos: desarrollo, control de calidad y producción. De esta manera, es posible separar los casos de uso para el desarrollo de contenido, las pruebas y el consumo en instancias independientes de Tableau Server. Si este es un requisito en su empresa, cada uno de los tres entornos deberá tener una licencia independiente, ya que se considerarían como tres entornos de producción según se define en el Acuerdo de licencia de usuario final de Tableau. Los entornos de producción y control de calidad deben tener especificaciones, topologías del servidor y configuraciones idénticas. Si debe ejecutar tres entornos independientes, intente no replicar un ciclo tradicional de desarrollo en cascada con una plataforma de análisis moderna. Los usuarios pueden recurrir al entorno de control de calidad a fin de eludir las directivas estrictas o evitar los retrasos para que el contenido llegue a producción. Por lo tanto, trabaje para lograr un equilibrio eficaz. Automatice la migración de contenido al servidor de producción con Tableau Content Migration Tool disponible en Tableau Advanced Management. También puede utilizar scripts de flujo de trabajo personalizados con las API de REST de Tableau. No es necesario que el entorno de desarrollo tenga especificaciones de hardware idénticas a los entornos de producción y control de calidad, a menos que se use para realizar pruebas de actualizaciones o participar en programas beta.

Alta disponibilidad

Debe instalar y configurar Tableau según sus requisitos de disponibilidad y agregar nodos adicionales para aumentar la capacidad u obtener una alta disponibilidad (Windows | Linux). A fin de admitir los casos de uso imprescindibles, debe implementar una configuración de clúster de alta disponibilidad (HA) con un equilibrador de carga (Windows | Linux).

Una instalación de alta disponibilidad de Tableau Server dispone de un mínimo de tres nodos y múltiples instancias redundantes de procesos clave (el repositorio, el almacén de archivos, el motor de datos y el servicio de coordinación) en diferentes nodos. El objetivo es minimizar el tiempo de inactividad del sistema al eliminar los puntos únicos de posibles errores y permitir su detección con la conmutación por error cuando sea posible. Para obtener más información, consulte el informe Alta disponibilidad de Tableau Server.

Siga el patrón que se indica a continuación para crear el clúster de alta disponibilidad:

  1. Instale el nodo inicial y permita que el instalador inteligente adaptable a la arquitectura configure los procesos (Windows | Linux). El repositorio activo se encuentra en el nodo 1.
  2. Replique la configuración del proceso en los otros nodos VizQL, a fin de garantizar la redundancia (Windows | Linux). El repositorio pasivo se encuentra en el nodo 2. Los procesos del nodo 3 serán idénticos a los de los nodos 1 y 2, excepto en el hecho de que no tendrá asignado un proceso de repositorio.
  3. Agregue el conjunto de servicios de coordinación y de archivos del cliente (Windows | Linux).
  4. Agregue el equilibrador de carga externo (Windows | Linux).

Una implementación HA de Tableau Server de 3 nodos (Nota: El servicio de coordinación y el servicio de archivos del cliente no se muestran explícitamente)

La necesidad de utilizar nodos especializados evoluciona con el tiempo. Las cargas de trabajo pesadas y frecuentes de actualizaciones de extracción deben aislarse de la carga de trabajo interactiva de visualización y representación. En un entorno en el que se realizan muchas extracciones, la mayoría de las fuentes de datos son extracciones. Contar con algunas extracciones extremadamente grandes podría poner su implementación en esta categoría, al igual que tener muchas extracciones pequeñas. Las implementaciones en las que las extracciones se actualizan con frecuencia, por ejemplo, varias veces cada día durante las horas hábiles, se deben aislar en nodos especializados del procesador en segundo plano. A fin de aislar la carga de trabajo en el procesador en segundo plano, agregue nodos especializados del procesador en segundo plano, según se indica en los nodos 4 y 5 a continuación. Mediante el uso de roles de nodo puede configurar dónde se procesan ciertos tipos de cargas de trabajo en la instalación de Tableau Server. Las funcionalidades de los roles de nodo le permiten escalar y dedicar los recursos a cargas de trabajo específicas. Para obtener más información sobre cómo configurar los roles del nodo para el procesador en segundo plano y el almacén de archivos, consulte, Gestión de la carga de trabajo mediante roles de nodo.

Una implementación HA de Tableau Server de 5 nodos (Nota: El servicio de coordinación y el servicio de archivos del cliente no se muestran explícitamente)

 

A partir de la versión 2019.3, puede implementar el repositorio de Tableau Server en Amazon Relational Database Service (RDS). El repositorio de Tableau Server es una base de datos de PostgreSQL que almacena datos de todas las interacciones de usuario, actualizaciones de extracción, etc. Amazon RDS ofrece escalabilidad, confiabilidad, alta disponibilidad y seguridad integrada para PostgreSQL. Al integrarse con AWS para configurar el repositorio externo de Tableau Server, podrá aprovechar las ventajas adicionales de la implementación de la nube. Para obtener más información, consulte Repositorio externo de Tableau Server.

Al implementar Tableau Server en la nube pública, tiene algunas opciones para mitigar aún más el riesgo de inactividad. Por ejemplo, puede implementar cada nodo de Tableau Server en su propia red virtual o en diferentes zonas o zonas de disponibilidad. Sin embargo, al dividir el entorno se podría generar mayor latencia en todo el sistema. Antes de completar la implementación del entorno, pruebe el rendimiento y la disponibilidad para asegurarse de contar con el equilibrio adecuado para su comunidad de datos. Tableau Server no es compatible con la implementación de un clúster de varios nodos en diferentes regiones.

Recuperación ante desastres

Cuando planifique la recuperación ante desastres (DR) en el entorno de Tableau, debe tener en cuenta dos factores primordiales: el tiempo objetivo de recuperación (RTO) y el objetivo de punto de restauración (RPO). El RTO es una medida que indica cuánto tiempo de inactividad es aceptable para la empresa antes de una recuperación completa. Esta influye en la frecuencia con la que se restauran las copias de seguridad en un clúster alternativo y la cantidad de inversión en infraestructura. El RPO mide la pérdida de datos que puede tolerar la empresa. Esta influye en la frecuencia con la que deberá realizar una copia de seguridad del sistema. Para Tableau Server, el RPO no puede ser inferior al tiempo que se tarda en completar una copia de seguridad completa del servidor. En la siguiente tabla se ilustra cómo planear una gama de requisitos de RTO:

 

RTO alto

RTO medio

RTO bajo

Obtención de nuevas máquinas virtuales o nuevo hardware en caso de interrupción.

Máquinas aprovisionadas, pero no en funcionamiento.

Hardware dedicado que siempre se ejecuta con la misma configuración y topología que en producción.

Instalar Tableau Server

Tableau Server instalado.

Las copias de seguridad se restauran con frecuencia en el entorno de DR.

Restauración de las copias de seguridad en el nuevo entorno.

Restauración de la última copia de seguridad en un entorno en espera inactiva.

El equilibrador de carga externo o el enrutamiento de DNS pueden actualizarse para concentrarse en el entorno de DR.

Varias horas o días.

Unas horas.

En cuestión de minutos.

 

Independientemente de si Tableau Server se hospeda en las instalaciones físicas o en la nube, el proceso para realizar copias de seguridad es el mismo. Use el comando TSM Backup (Copia de seguridad de TSM) para crear una copia de seguridad de Tableau Server. Luego, puede restaurar esa copia en una nueva máquina. No es posible tomar una instantánea de una máquina de Tableau Server y restaurarla en una nueva máquina. Para obtener más información, consulte Confiabilidad fundamental para el negocio. Allí podrá explorar definiciones e informes sobre la alta disponibilidad y la recuperación ante desastres.

¡Gracias por sus comentarios!Sus comentarios se han enviado correctamente. ¡Gracias!