Acerca de Data Connect
Data Connect permite a los usuarios de Tableau Cloud acceder a fuentes de datos en su red privada o servicio en la nube. Data Connect opera como un modelo de responsabilidad compartida. Con este modelo, los clientes suministran los recursos informáticos físicos o virtuales, y Tableau aloja y administra el clúster Kubernetes de Data Connect en esos recursos.
En su entorno, el clúster de Kubernetes de Data Connect supervisa un conjunto de contenedores. Los contenedores son compatibles con el entorno de ejecución, que consta de uno o más agentes. El agente es el programa que ejecuta las tareas y permite una comunicación segura entre su organización a través del firewall.
Los servicios de Data Connect incluyen:
Supervisión y solución de problemas del clúster: Tableau supervisa el estado y el uso del agente de Data Connect. Los datos de telemetría se recopilan para garantizar que los recursos se utilicen de la manera más efectiva y eficiente.
Mantenimiento del clúster: las actualizaciones se implementan de forma automática, y la operación y el mantenimiento del clúster son propiedad de Tableau, que es quien se encarga de llevarlos a cabo en su totalidad. Data Connect optimiza automáticamente la implementación para la carga de trabajo según las necesidades y el grupo de computación disponible.
Supervisión de alertas: el sistema de gestión de incidencias opera de forma continuada para resolver rápidamente los problemas y limitar su impacto empresarial.
Compatibilidad de conectores
Data Connect admite los mismos conectores que admite Tableau Bridge para Linux. Para ver una revisión completa de las opciones de conectividad, consulte Conectividad con Bridge.
Apoyo al medio ambiente
Actualmente, Data Connect admite entornos locales y VCP: Amazon Web Services (AWS), Microsoft Azure y Google Cloud Platform (GCP). Los nodos de Data Connect son compatibles con un solo sitio de Tableau Cloud. Los nodos deben instalarse en la misma red que los datos. Por lo tanto, los clientes deben planificar al menos tres nodos por red privada por sitio para mantener la disponibilidad del servicio. Los nodos de Data Connect deben estar dedicados a Data Connect. No puede implementar ningún otro contenedor en el clúster propiedad de Tableau. Y no puede usar un clúster existente para Data Connect.
Arquitectura
La arquitectura de Data Connect consta de tres componentes principales y tres límites de responsabilidad. Si bien existe cierta superposición, Tableau se encarga principalmente de las capas de aplicación y organización, y los clientes se ocupan de la infraestructura (computación, sistema operativo, redes y almacenamiento) y de su ubicación.
Tableau Cloud → servicio de organización
Clúster de Kubernetes → servicio de organización
Clúster de Kubernetes → contenedor
Usuario de Tableau → Tableau Cloud
Agente de Data Connect (contenedor) → Tableau Cloud
Agente de Data Connect (contenedor) → base de datos del cliente
Seguridad
Consulte Seguridad de Data Connect.
Componentes de Data Connect
El componente principal de la solución Data Connect es un clúster. El clúster es un clúster de Kubernetes que está formado por uno o más nodos. Cada nodo de Kubernetes aloja al menos un contenedor, que a su vez aloja al agente de Data Connect. Los agentes realizan consultas en tiempo real y de extracción.
Una agrupación es una conjunto lógico de reglas de red que especifican qué clústeres deben completar consultas específicas. En el contexto de la planificación de la implementación, una agrupación aloja una colección de puntos finales (dominios o direcciones IP) con el fin de equilibrar la carga. Los dominios incluyen datos de nube privada, datos relacionales, datos de archivos, etc.
Para permitir que un clúster acceda y actualice las fuentes de datos, cada grupo se asigna a un clúster. Para distribuir la carga, puede agregar varios grupos a un clúster.
Descripción general de la implementación
Para comenzar, ejecute un script en cada uno de sus servidores Linux. Este script configura un clúster de Kubernetes administrado por Tableau en su entorno. El clúster de Kubernetes está administrado por Tableau.
Una vez configurado Kubernetes, implementa un contenedor Docker en el clúster. Luego, Tableau implementará y administrará de forma remota el agente de Data Connect dentro del contenedor. Una vez establecida esta configuración con Tableau, podrá asignar conexiones a sus fuentes de datos de red privada.
Conectividad de base de datos
Las consultas se administran desde el agente de Data Connect en el clúster. Los datos se transmiten directamente desde el agente de Data Connect a Tableau Cloud. Data Connect no requiere acceso a redes externas ni máquinas remotas, ni agujeros en el firewall.
El agente establece una conexión persistente con el servicio Tableau Cloud Data Connect mediante WebSockets seguros (wss://). A continuación, el cliente espera una petición de Tableau Cloud.
- Para fuentes de datos con conexiones en tiempo real o conexiones virtuales, Tableau Cloud inicia una consulta al agente de Data Connect.
- Para las fuentes de datos con conexión de extracción que utilizan programas de actualización, el cliente recibe la solicitud de programa de actualización y se comunica con Tableau Cloud utilizando una conexión segura (https://) para los archivos de fuente de datos (.tds).
El agente se conecta a los datos de redes privadas mediante las credenciales que se incluyen en la solicitud de trabajo.
La base de datos devuelve los resultados de la consulta.
El agente de Data Connect recibe la carga útil y la devuelve al servicio Data Connect.