Planificar la implementación de Data Connect

Data Connect es un servicio de suscripción paga disponible para clientes de Tableau Cloud Enterprise y Tableau. Después de comprar Data Connect, el administrador del sitio podrá configurar el servicio en la página de configuración de Tableau Cloud.

Especificaciones de infraestructura

  • Computación: una ubicación para alojar Data Connect. Puede ser un equipo sin sistema operativo o una máquina virtual, y puede estar ubicada en una red privada o en la nube.

  • Sistema operativo (SO): una instalación actualizada de una distribución de Linux compatible que incluya los parches más recientes.

  • Almacenamiento: el espacio de almacenamiento asignado para alojar el sistema operativo, Data Connect y las extracciones que crea al realizar las actualizaciones.

  • Red: el equipo debe poder conectarse a la fuente de datos y a dos ubicaciones públicas de Internet.

Especificaciones del nodo

Número de nodos

Carga de trabajo de producción mínima: tres nodos por red

Carga de trabajo mínima de desarrollo/prueba: un nodo por red

Microprocesadores virtualesMínimo: 8 microprocesadores virtuales
Recomendado: 16 microprocesadores o más
MemoriaMínimo: 16 GB
Recomendado: 64 GB o más

Almacenamiento (dos discos)

Importante: El disco secundario no debe tener formato.

Disco raíz
Mínimo: 200 GB de espacio en disco
Recomendado: más de 300 GB

Disco secundario
Mínimo: 200 GB
Recomendado: más de 500 GB

PermisoAcceso raíz al host

Sistema operativo Linux

Distribuciones compatiblesRHEL-8
RHEL-9
Ubuntu-20.04
Ubuntu-22.04

Especificaciones de red

Filtrado de proxyConsulte Filtrado de proxy de reenvío opcional.
Autenticación de cliente TLS saliente en el puerto 443 con autenticación TLS mutua
(Capa de organización)
52.42.211.235
52.10.6.79
35.167.70.143
Listado saliente de los nombres de dominio completamente calificados (FQDN)
(Capa de organización)
tunnel.rafay-edge.net
api.rafay.dev
control.rafay.dev
fluentd-aggr.rafay-edge.net
influxdb01.core.rafay-edge.net
debug.core.rafay-edge.net
edge.core.rafay-edge.net
registry.rafay-edge.net
app.rafay.dev
console.rafay.dev
*.connector.kubeapi-proxy.rafay.dev
*.user.kubeapi-proxy.rafay.dev
event.core.rafay-edge.net
repo.rafay-edge.net
*.connector.cdrelay.rafay.dev
*.user.cdrelay.rafay.dev
*.connector.infrarelay.rafay.dev
*.user.infrarelay.rafay.dev

Red interna

Los nodos del clúster necesitarán el mismo acceso de red a la fuente de datos que requiere Tableau Desktop.

Permisos de Tableau CloudRol de administrador de sitio y credenciales para acceder a la fuente de datos.
Fuente de datosUn método de autenticación para la fuente de datos que Data Connect admita actualmente y al que se pueda acceder a través de la red desde el clúster.

Acceso a la base de datos

Data Connect usa conectores de Tableau para conectarse a las distintas bases de datos con el objetivo de mantener los datos actualizados. Algunos de estos conectores requieren controladores para comunicarse con las bases de datos. Para descargar los controladores para conectores compatibles con Data Connect, consulte la página Descarga de controladores de Tableau y filtre por Linux. Data Connect solo admite controladores de Linux. Asegúrese de utilizar las instrucciones enumeradas para cada base de datos.

Autenticación de base de datos

Los datos subyacentes a los que se conecta una fuente de datos, flujo de datos de Prep Conductor o conexión virtual a menudo requieren autenticación. Si se requiere autenticación, el publicador o el propietario pueden configurar cómo se obtienen las credenciales de la base de datos.

Fuentes de datos

Las opciones de configuración para la autenticación en fuentes de datos son: Preguntar al usuario o Contraseña insertada.

  • Si la fuente de datos se configura para preguntar a los usuarios, las credenciales de la base de datos no se almacenan con la conexión. Esto significa que un usuario que abra la fuente de datos (o libro de trabajo que usa la fuente de datos) debe escribir sus propias credenciales de la base de datos para tener acceso a los datos.

  • Si se configura una fuente de datos con la contraseña insertada, las credenciales de la base de datos se guardan con la conexión y las puede usar cualquier persona que tenga acceso a la fuente de datos (o actualice la fuente de datos).

Para obtener más información, consulte Establecer las credenciales para acceder a los datos publicados(El enlace se abre en una ventana nueva).

Tableau Prep Conductor y conexiones virtuales

Las credenciales de la base de datos se almacenan en un flujo de preparación o en una conexión virtual. Para los flujos de Prep, las credenciales se utilizan cuando se ejecuta un flujo de Prep Conductor. Para las conexiones virtuales, estas credenciales las utiliza cualquier persona que acceda a la conexión virtual.

Para obtener más información sobre la administración de credenciales de fuentes de datos, consulte Seguridad de Data Connect.

Planificación de la capacidad

Hay varias herramientas disponibles para que los administradores gestionen la capacidad de sus cargas de trabajo en Data Connect.

Los componentes del servicio de Data Connect incluyen redes privadas, grupos, clústeres y nodos.

Administración de clústeres

Los clústeres de Data Connect son un clúster de nodos que acceden a datos dentro de una red privada específica. Esos nodos pueden acceder a cualquier base de datos dentro de su red a la que hayan sido configurados para acceder. Todos los clientes de Bridge en todos los nodos de ese clúster pueden manejar cargas de trabajo para cualquier sitio que tenga acceso al clúster. Para aumentar la capacidad de un clúster, puede agregar nodos al clúster para aumentar el rendimiento o aumentar el tamaño del equipo (CPU, memoria, etc.).

Equilibrio de carga con agrupaciones

Cada clúster utiliza una agrupación para equilibrar la carga del tráfico entre todos los clientes de Bridge del clúster. Tener varios nodos dentro de cada clúster garantiza que tenga varios clientes de Bridge disponibles para manejar el tráfico asociado con la agrupación. Por cada dominio agregado a un grupo, todo el tráfico hacia ese dominio se equilibra en todo el clúster. Los dominios no se pueden agregar a más de una agrupación en un sitio. Este diseño garantiza que el tráfico se dirija de forma adecuada.

Límites del sitio

Se aplican límites de sitio a los trabajos entregados por Data Connect para garantizar una buena experiencia para todos los clientes en Tableau Cloud. Los límites que se aplican son los mismos que los que se aplican para Tableau Bridge porque Data Connect implementa Tableau Bridge en su nombre para atender las consultas de bases de datos. Para obtener más información sobre esos límites, consulte Capacidad del sitio de Bridge.

Para obtener más información sobre la planificación de la capacidad, descargue el documento técnico. Acceder a los datos de su red privada con Tableau Cloud.