À propos de Data Connect
Dans votre environnement, le cluster Data Connect Kubernetes supervise un ensemble de conteneurs Docker. Les conteneurs prennent en charge l’environnement d’exécution composé d’un ou de plusieurs agents. L’agent est le programme qui exécute les tâches et permet une communication sécurisée à travers le pare-feu dans votre organisation.
Les services Data Connect comprennent :
Surveillance et dépannage du cluster : Tableau surveille l’intégrité et l’utilisation de l’agent Data Connect. Les données de télémétrie sont collectées pour garantir que les ressources sont utilisées de la manière la plus efficace et la plus efficiente possible.
Maintenance du cluster : les mises à niveau sont automatiquement déployées, et l’exploitation et la maintenance du cluster appartiennent et reviennent entièrement à Tableau. Data Connect optimise automatiquement le déploiement de votre charge de travail en fonction des besoins et du pool de calcul disponible.
Surveillance des alertes : la gestion des incidents est assurée en continu afin de résoudre les problèmes rapidement et d’en limiter l’impact pour l’entreprise.
Prise en charge des connecteurs
Data Connect prend en charge les mêmes connecteurs que Tableau Bridge pour Linux. Pour un aperçu complet des options de connectivité, veuillez consulter Connectivité avec Bridge.
Prise en charge de l’environnement
Data Connect prend actuellement en charge les environnements sur site et VCP : Amazon Web Services (AWS), Microsoft Azure et Google Cloud Platform (GCP). Les nœuds Data Connect sont compatibles avec un seul site Tableau Cloud. Ils doivent être installés sur le même réseau que les données. Les clients doivent donc prévoir au moins trois nœuds par réseau privé par site pour maintenir la disponibilité du service. Les nœuds Data Connect doivent être dédiés à Data Connect. Vous ne pouvez pas déployer d’autres conteneurs sur le cluster appartenant à Tableau. et vous ne pouvez pas utiliser un cluster existant pour Data Connect.
Présentation
L’architecture Data Connect repose sur trois composants principaux et des limites de responsabilité. Il existe bien quelques chevauchements, mais Tableau est principalement responsable des couches d’application et d’orchestration, et les clients sont responsables de l’infrastructure (calcul, système d’exploitation, réseau et stockage) et de son emplacement.
Pour commencer, vous exécutez un script sur chacun de vos serveurs Linux, ce qui génère un cluster Kubernetes géré par Tableau dans votre environnement. Ce cluster Kubernetes est ensuite géré par Tableau en créant une connexion sortante du cluster vers deux emplacements gérés.
Vous créez et déployez ensuite un conteneur Docker sur votre cluster Kubernetes. Tableau peut alors déployer et gérer à distance l’agent Data Connect dans un conteneur Docker via la connexion sortante du cluster. Après avoir établi la connexion, vous pouvez spécifier le mappage vers les sources de données de votre réseau privé et les utiliser pour accéder à vos données.
Vos données sont transmises directement de l’agent Data Connect à Tableau Cloud. Data Connect n’a pas besoin d’un accès au réseau externe, de perçage de pare-feu ni d’accès à une machine distante.
Architecture
Tableau Cloud -> service d’orchestration
Cluster Kubernetes -> service d’orchestration
Cluster Kubernetes -> conteneur Docker
Utilisateur Tableau -> Tableau Cloud
Agent Data Connect (conteneur Docker) -> Tableau Cloud
Agent Data Connect (conteneur Docker) -> base de données clients
Limites de l’environnement
Application
Les conteneurs Data Connect offrent des fonctionnalités d’évolutivité et de gestion rationalisées pour les charges de travail conteneurisées.
Orchestration
Un cluster Kubernetes géré et entretenu à distance hébergeant les conteneurs Data Connect.
Infrastructure
Le stockage, la mise en réseau et le calcul (SE, CPU, mémoire) sont les ressources requises pour la couche d’infrastructure informatique.