À propos de Data Connect
Data Connect permet aux utilisateurs de Tableau Cloud d’accéder aux sources de données sur votre service réseau ou cloud privé. Data Connect fonctionne comme un modèle de responsabilité partagée. Avec ce modèle, les clients fournissent les ressources de calcul physiques ou virtuelles, et Tableau héberge et gère le cluster Data Connect Kubernetes sur ces ressources.
Dans votre environnement, le cluster Data Connect Kubernetes supervise un ensemble de conteneurs. Les conteneurs prennent en charge l’environnement d’exécution composé d’un ou de plusieurs agents. L’agent est le programme qui exécute les tâches et permet une communication sécurisée à travers le pare-feu dans votre organisation.
Les services Data Connect comprennent :
Surveillance et dépannage du cluster : Tableau surveille l’intégrité et l’utilisation de l’agent Data Connect. Les données de télémétrie sont collectées pour garantir que les ressources sont utilisées de la manière la plus efficace et la plus efficiente possible.
Maintenance du cluster : les mises à niveau sont automatiquement déployées, et l’exploitation et la maintenance du cluster appartiennent et reviennent entièrement à Tableau. Data Connect optimise automatiquement le déploiement de votre charge de travail en fonction des besoins et du pool de calcul disponible.
Surveillance des alertes : la gestion des incidents est assurée en continu afin de résoudre les problèmes rapidement et d’en limiter l’impact pour l’entreprise.
Prise en charge des connecteurs
Data Connect prend en charge les mêmes connecteurs que Tableau Bridge pour Linux. Pour un aperçu complet des options de connectivité, veuillez consulter Connectivité avec Bridge.
Prise en charge de l’environnement
Data Connect prend actuellement en charge les environnements sur site et VCP : Amazon Web Services (AWS), Microsoft Azure et Google Cloud Platform (GCP). Les nœuds Data Connect sont compatibles avec un seul site Tableau Cloud. Ils doivent être installés sur le même réseau que les données. Les clients doivent donc prévoir au moins trois nœuds par réseau privé par site pour maintenir la disponibilité du service. Les nœuds Data Connect doivent être dédiés à Data Connect. Vous ne pouvez pas déployer d’autres conteneurs sur le cluster appartenant à Tableau. et vous ne pouvez pas utiliser un cluster existant pour Data Connect.
Architecture
L’architecture Data Connect repose sur trois composants principaux et des limites de responsabilité. Il existe bien quelques chevauchements, mais Tableau est principalement responsable des couches d’application et d’orchestration, et les clients sont responsables de l’infrastructure (calcul, système d’exploitation, réseau et stockage) et de son emplacement.
Tableau Cloud → service d’orchestration
Cluster Kubernetes → service d’orchestration
Cluster Kubernetes → conteneur
Utilisateur Tableau → Tableau Cloud
Agent Data Connect (conteneur) → Tableau Cloud
Agent Data Connect (conteneur) → base de données client
Sécurité
Voir Sécurité de Data Connect.
Composants de Data Connect
Le composant principal de la solution Data Connect est un cluster. Le cluster est un cluster Kubernetes composé d’un ou plusieurs nœuds. Chaque nœud Kubernetes héberge au moins un conteneur, qui à son tour héberge l’agent Data Connect. Les agents exécutent des requêtes en direct et basées sur des extraits.
Un pool est un regroupement logique de règles réseau qui spécifient quels clusters doivent répondre à des requêtes spécifiques. Dans le contexte de la planification du déploiement, un pool héberge une collection de points de terminaison (domaines ou adresses IP) à des fins d’équilibrage de charge. Les domaines incluent les données de cloud privé, les données relationnelles, les données de fichiers, etc.
Pour permettre à un cluster d’accéder aux sources de données et de les actualiser, chaque pool est attribué à un cluster. Pour répartir la charge, vous pouvez ajouter plusieurs pools à un cluster.
Présentation du déploiement
Pour commencer, exécutez un script sur chacun de vos serveurs Linux. Ce script configure un cluster Kubernetes géré par Tableau dans votre environnement. Le cluster Kubernetes est géré par Tableau.
Une fois Kubernetes configuré, vous déployez un conteneur Docker sur le cluster. Tableau déploiera ensuite et gérera à distance l’agent Data Connect au sein du conteneur. Une fois cette configuration avec Tableau établie, vous allez mapper les connexions à vos sources de données de réseau privé.
Connectivité de la base de données
Les requêtes sont gérées depuis l’agent Data Connect dans le cluster. Vos données sont transmises directement de l’agent Data Connect à Tableau Cloud. Data Connect n’a pas besoin d’un accès au réseau externe, de perçage de pare-feu ni d’accès à une machine distante.
L’agent établit une connexion persistante avec le service Data Connect Tableau Cloud en utilisant des WebSockets sécurisés (wss://). Le client attend ensuite que Tableau Cloud envoie une demande.
- Pour les sources de données avec des connexions en direct ou des connexions virtuelles, Tableau Cloud lance une requête auprès de l’agent Data Connect.
- Pour les sources de données avec connexion aux extraits qui utilisent des programmations d’actualisation, le client reçoit la demande de programmation d’actualisation et contacte Tableau Cloud via une connexion sécurisée (https://) pour les fichiers de source de données (.tds).
L’agent se connecte aux données de réseau privé à l’aide des informations d’identification intégrées dans la demande de travail.
La base de données renvoie les résultats de la requête.
L’agent Data Connect reçoit la charge utile et la renvoie au service Data Connect.