Programmer votre déploiement Data Connect
Data Connect est un service d’abonnement payant disponible pour les clients Tableau Cloud Enterprise et Tableau+. Une fois que vous aurez acheté Data Connect, l’administrateur de site pourra configurer le service dans la page des paramètres de Tableau Cloud.
Spécifications de l’infrastructure
Calculs : un emplacement pour héberger Data Connect. Il peut s’agir d’un système nu ou d’une machine virtuel et se trouver dans un réseau privé ou dans le cloud.
Système d’exploitation (SE) : une installation à jour, avec les correctifs appliqués, d’une distribution Linux prise en charge.
Stockage : un espace de stockage alloué pour héberger le système d’exploitation, Data Connect et les extraits créés lors des actualisations.
Réseau : le moteur de calcul doit pouvoir se connecter à votre source de données et à deux emplacements sur l’Internet public.
Spécifications du nœud
Nombre de nœuds | Charge de travail de production minimum : trois nœuds par réseau Charge de travail de développement/test minimum : un nœud par réseau |
vCPU | Minimum : 8 processeurs virtuels Recommandé : 16 processeurs virtuels ou plus |
Mémoire | Minimum : 16 Go Recommandé : 64 Go ou plus |
Stockage (deux disques) Important : le disque secondaire doit être brut et non formaté. | Disque racine Disque secondaire |
Autorisation | Accès root à l’hôte |
Système d’exploitation Linux
Distributions prises en charge | RHEL-8 RHEL-9 Ubuntu-20.04 Ubuntu-22.04 |
Filtrage proxy | Consultez Filtrage facultatif du proxy de transfert. |
Authentification client TLS sortante sur le port 443 avec authentification TLS mutuelle (Couche d’orchestration) | 52.42.211.235 52.10.6.79 35.167.70.143 |
Liste sortante des noms de domaines qualifiés complets (FQDN) (Couche d’orchestration) | tunnel.rafay-edge.net api.rafay.dev control.rafay.dev fluentd-aggr.rafay-edge.net influxdb01.core.rafay-edge.net debug.core.rafay-edge.net edge.core.rafay-edge.net registre.rafay-edge.net app.rafay.dev console.rafay.dev *.connector.kubeapi-proxy.rafay.dev *.user.kubeapi-proxy.rafay.dev event.core.rafay-edge.net repo.rafay-edge.net *.connector.cdrelay.rafay.dev *.user.cdrelay.rafay.dev *.connector.infrarelay.rafay.dev *.user.infrarelay.rafay.dev |
Réseau interne | Les nœuds du cluster auront besoin du même accès réseau à la source de données que celui requis par Tableau Desktop. |
Autorisations Tableau Cloud | Rôle d’administrateur de site et informations d’identification pour accéder à la source de données. |
Source de données | Méthode d’authentification pour la source de données actuellement prise en charge par Data Connect et accessible via le réseau depuis le cluster. |
Accès aux bases de données
Data Connect utilise des connecteurs Tableau pour se connecter à différentes bases de données afin que les données soient toujours à jour. Certains de ces connecteurs nécessitent que les pilotes communiquent avec les bases de données. Pour obtenir les pilotes d’autres connecteurs pris en charge par Data Connect, accédez à la page Téléchargement de pilotes et filtrez sur Linux. Data Connect prend uniquement en charge les pilotes Linux. Veillez suivre les instructions répertoriées pour chaque base de données.
Authentification de la base de données
Les données sous-jacentes auxquelles une source de données, un flux Prep Conductor ou une connexion virtuelle se connecte exigent souvent une authentification. Si l’authentification est requise, le publicateur ou le propriétaire peut configurer le mode d’obtention des informations d’identification pour la base de données.
Sources de données
Les options de configuration de l’authentification pour les sources de données sont Inviter l’utilisateur ou Mot de passe intégré.
Si la source de données est définie sur « Inviter l’utilisateur », les informations d’identification pour la base de données ne sont pas stockées avec la connexion. Cela signifie qu’un utilisateur qui ouvre la source de données (ou le classeur utilisant la source de données) doit entrer ses propres informations d’identification pour la base de données afin d’accéder aux données.
Si une source de données est configurée avec le mot de passe intégré, les informations d’identification pour la base de données sont enregistrées avec la connexion et utilisées par toute personne qui accède à la source de données (ou l’actualise).
Pour plus d’informations, consultez Définir les informations d’identification pour accéder à vos données publiées(Le lien s’ouvre dans une nouvelle fenêtre).
Tableau Prep Conductor et connexions virtuelles
Les informations d’identification pour la base de données sont stockées dans un flux Prep ou une connexion virtuelle. Pour les flux Prep, les informations d’identification sont utilisées lors de l’exécution d’un flux Prep Conductor. Pour les connexions virtuelles, ces informations d’identification sont utilisées par toute personne qui accède à la connexion virtuelle.
Pour plus d’informations sur la gestion des informations d’identification pour les sources de données, veuillez consulter Sécurité de Data Connect.
Planification de la capacité
Plusieurs outils sont à la disposition des administrateurs pour gérer la capacité de leurs charges de travail sur Data Connect.
Gestion des clusters
Les clusters Data Connect sont un cluster de nœuds qui accèdent aux données au sein d’un réseau privé spécifié. Ces nœuds peuvent accéder à toutes les bases de données du réseau auxquelles leur configuration leur permet d’accéder. Tous les clients Bridge sur tous les nœuds de ce cluster peuvent gérer les charges de travail de tous les sites ayant accès au cluster. Pour accroître la capacité d’un cluster, vous pouvez ajouter des nœuds au cluster afin d’améliorer le débit ou augmenter la taille de l’ordinateur (CPU, mémoire, etc.).
Équilibrage de charge avec des pools
Chaque cluster utilise un pool pour équilibrer la charge du trafic sur tous les clients Bridge du cluster. En disposant de plusieurs nœuds dans chaque cluster, vous avez l’assurance que plusieurs clients Bridge sont disponibles pour gérer le trafic associé au pool. Pour chaque domaine ajouté à un pool, toute la charge du trafic vers ce domaine est équilibré à l’échelle du cluster. Les domaines ne peuvent pas être ajoutés à plusieurs pools sur un site. Cette conception garantit que le trafic est acheminé de manière appropriée.
Limites de site
Des limites de site s’appliquent aux travaux effectués par Data Connect afin d’assurer une expérience satisfaisante à tous les clients sur Tableau Cloud. Les limites appliquées sont les mêmes que celles en vigueur pour Tableau Bridge, car Data Connect déploie Tableau Bridge en votre nom pour traiter les requêtes de base de données. Pour plus d’informations sur ces limites, consultez Capacité du site Bridge.
Pour plus d’informations sur la planification de la capacité, téléchargez le livre blanc Accéder aux données de votre réseau privé avec Tableau Cloud.