À propos de Data Connect
Data Connect permet aux utilisateurs de Tableau Cloud d’accéder aux sources de données sur votre réseau privé ou votre service en nuage. Data Connect utilise un modèle de responsabilité partagée. Ce modèle permet aux clients de fournir des ressources de calcul physiques ou virtuelles, et Tableau héberge le groupement Kubernetes de Data Connect sur ces ressources et en assure la gestion.
Dans votre environnement, le groupement Kubernetes de Data Connect supervise un ensemble de conteneurs. Les conteneurs prennent en charge l’environnement d’exécution qui comporte un ou plusieurs clients Bridge. Le client Bridge est le programme qui exécute les tâches et permet d’établir une communication sécurisée au travers des pare-feu de votre entreprise.
Services Data Connect :
Surveillance et résolution de problèmes liés aux groupements : Tableau surveille l’intégrité et l’utilisation du client Bridge. Les données de télémétrie sont collectées pour s’assurer que les ressources sont utilisées avec une efficacité maximale.
Maintenance du groupement : Le déploiement des mises à niveau est automatique et Tableau assure entièrement l’exploitation et la maintenance du groupement. Data Connect optimise automatiquement le déploiement de votre charge de travail en fonction de vos besoins et du pool de ressources informatiques disponibles.
Surveillance des alertes : La gestion des incidents est faite en continu pour résoudre rapidement les problèmes et limiter l’impact sur l’entreprise.
Prise en charge du connecteur
Data Connect prend en charge les mêmes connecteurs que Tableau Bridge pour Linux. Pour un aperçu complet des options de connexion, veuillez consulter la section Connectivité avec Bridge.
Prise en charge de l’environnement
Data Connect prend actuellement en charge les environnements sur site et sur VCP : Amazon Web Services (AWS), Microsoft Azure et Google Cloud Platform (GCP). Les nœuds Data Connect sont compatibles avec un seul site Tableau Cloud. Les nœuds doivent être installés sur le même réseau que les données. Les clients doivent donc prévoir trois nœuds par réseau privé au minimum pour maintenir la disponibilité du service. Les nœuds Data Connect doivent être dédiés à Data Connect. Vous ne pouvez pas déployer d’autres conteneurs sur un groupement appartenant à Tableau. Vous ne pouvez pas également utiliser un groupement existant pour Data Connect.
L’architecture de Data Connect comprend trois composants principaux et des limites de responsabilité. Malgré le chevauchement qui existe dans certains cas, Tableau est principalement responsable des couches d’application et d’orchestration. Les clients sont eux responsables de l’infrastructure (calcul, système d’exploitation, réseau et stockage) et de son emplacement.
Tableau Cloud communique avec le service d’orchestration Kubernetes pour déployer, surveiller et gérer l’orchestration Kubernetes.
Lorsque vous initialisez Data Connect, une connexion sécurisée est établie avec le fournisseur du service d’orchestration par l’intermédiaire du port 443.
Une fois le service configuré, un cluster Kubernetes déploie un ou plusieurs conteneurs avec un ou plusieurs clients Bridge. Ces clients Bridge seront responsables de l’exécution des charges de travail de Tableau.
Les utilisateurs de Tableau Cloud se connectent à Tableau Cloud pour interagir avec le service Data Connect.
Lors de la configuration, les clients Bridge initialisent une connexion avec Tableau Cloud en utilisant HTTPS. Une fois la connexion établie, les clients Bridge initient une communication bidirectionnelle sécurisée avec votre environnement Tableau Cloud à l’aide d’une connexion WebSocket (wss://).
Les requêtes initiées depuis Tableau Cloud sont exécutées sur votre base de données pour prendre en charge l.analyse de l’utilisateur final.
Sécurité
Consultez Sécurité de Data Connect.
Composants de Data Connect
Le composant principal de la solution Data Connect est un groupement. Il s’agit d’un groupement Kubernetes composé d’un ou de plusieurs nœuds. Chaque nœud Kubernetes héberge au moins un conteneur, qui à son tour héberge le client Bridge. Le client Bridge exécute des requêtes en direct et d’extrait.
Un pool est un regroupement logique de règles de réseau qui spécifient quels groupements doivent exécuter des requêtes spécifiques. Dans le contexte de la planification du déploiement, un pool héberge une collection de points de terminaison (adresses de domaines ou adresses IP) à des fins d’équilibrage de charge. Les domaines incluent les données dans le nuage privé, les données relationnelles, les données de fichiers, etc.
Pour permettre à un groupement d’accéder aux sources de données et de les actualiser, chaque pool est affecté à un groupement. Pour répartir la charge, vous pouvez ajouter plusieurs pools à un groupement.
Présentation du déploiement
Pour démarrer, exécutez un script sur chacun de vos serveurs Linux. Ce script configure un groupement Kubernetes géré par Tableau dans votre environnement. Le groupement Kubernetes est géré par Tableau.
Une fois Kubernetes configuré, vous déployez un conteneur Docker sur le groupement. Tableau va ensuite déployer et gérer à distance le client Bridge dans le conteneur. Après la configuration avec Tableau, vous mapperez ensuite les connexions à vos sources de données de réseau privé.
Pour plus d’informations sur le déploiement de Data Connect, téléchargez le document technique Accéder aux données de votre réseau privé avec Tableau Cloud - Meilleures pratiques pour Data Connect et Tableau Bridge(Le lien s’ouvre dans une nouvelle fenêtre).
Connectivité de la base de données
Les requêtes sont gérées à partir du client Bridge dans le groupement. Vos données sont transmises directement à Tableau Cloud à partir du client Bridge. Data Connect ne requiert pas un accès au réseau externe, des failles de pare-feu ou un accès à distance aux machines.
Le client Bridge établit une connexion permanente avec le service Data Connect Tableau Cloud en utilisant des WebSockets sécurisés (wss://). Le client attend ensuite que Tableau Cloud envoie une demande.
- Pour les sources de données avec des connexions en direct ou des connexions virtuelles, Tableau Cloud lance une requête auprès du client Bridge.
- Pour les sources de données avec connexion d’extrait qui utilisent des programmations d’actualisation, le client reçoit la demande de programmation d’actualisation et contacte Tableau Cloud à l’aide d’une connexion sécurisée (https://) pour les fichiers de source de données (.tds).
Le client Bridge se connecte aux données du réseau privé à l’aide des identifiants inclus dans la demande de travail.
La base de données renvoie les résultats de la requête.
Le client Bridge reçoit la charge utile et la retourne au service Data Connect.