Programmer votre déploiement Data Connect

Data Connect est un service d’abonnement payant disponible pour les clients Tableau Cloud Enterprise et Tableau+. Une fois que vous aurez acheté Data Connect, l’administrateur de site pourra configurer le service dans la page des paramètres de Tableau Cloud.

Spécifications de l’infrastructure

  • Calculs : un emplacement pour héberger Data Connect. Il peut s’agir d’un système nu ou d’une machine virtuel et se trouver dans un réseau privé ou dans le cloud.

  • Système d’exploitation (SE) : une installation à jour, avec les correctifs appliqués, d’une distribution Linux prise en charge.

  • Stockage : un espace de stockage alloué pour héberger le système d’exploitation, Data Connect et les extraits créés lors des actualisations.

  • Réseau : le moteur de calcul doit pouvoir se connecter à votre source de données et à deux emplacements sur l’Internet public.

Spécifications du nœud

Nombre de nœuds

Charge de travail de production minimum : trois nœuds par réseau

Charge de travail de développement/test minimum : un nœud par réseau

vCPUMinimum : 8 processeurs virtuels
Recommandé : 16 processeurs virtuels ou plus
MémoireMinimum : 16 Go
Recommandé : 64 Go ou plus

Stockage (deux disques)

Important : le disque secondaire doit être brut et non formaté.

Disque racine
Minimum : 200 Go d’espace disque
Recommandé : supérieur à 300 Go

Disque secondaire
Minimum : 200 Go
Recommandé : supérieur à 500 Go

AutorisationAccès root à l’hôte

Système d’exploitation Linux

Distributions prises en chargeRHEL-8
RHEL-9
Ubuntu-20.04
Ubuntu-22.04

Spécifications réseau

Filtrage proxyConsultez Filtrage facultatif du proxy de transfert.
Authentification client TLS sortante sur le port 443 avec authentification TLS mutuelle
(Couche d’orchestration)
52.42.211.235
52.10.6.79
35.167.70.143
Liste sortante des noms de domaines qualifiés complets (FQDN)
(Couche d’orchestration)
tunnel.rafay-edge.net
api.rafay.dev
control.rafay.dev
fluentd-aggr.rafay-edge.net
influxdb01.core.rafay-edge.net
debug.core.rafay-edge.net
edge.core.rafay-edge.net
registre.rafay-edge.net
app.rafay.dev
console.rafay.dev
*.connector.kubeapi-proxy.rafay.dev
*.user.kubeapi-proxy.rafay.dev
event.core.rafay-edge.net
repo.rafay-edge.net
*.connector.cdrelay.rafay.dev
*.user.cdrelay.rafay.dev
*.connector.infrarelay.rafay.dev
*.user.infrarelay.rafay.dev

Réseau interne

Les nœuds du cluster auront besoin du même accès réseau à la source de données que celui requis par Tableau Desktop.

Autorisations Tableau CloudRôle d’administrateur de site et informations d’identification pour accéder à la source de données.
Source de donnéesMéthode d’authentification pour la source de données actuellement prise en charge par Data Connect et accessible via le réseau depuis le cluster.

Accès aux bases de données

Data Connect utilise des connecteurs Tableau pour se connecter à différentes bases de données afin que les données soient toujours à jour. Certains de ces connecteurs nécessitent que les pilotes communiquent avec les bases de données. Pour obtenir les pilotes d’autres connecteurs pris en charge par Data Connect, accédez à la page Téléchargement de pilotes et filtrez sur Linux. Data Connect prend uniquement en charge les pilotes Linux. Veillez suivre les instructions répertoriées pour chaque base de données.

Authentification de la base de données

Les données sous-jacentes auxquelles une source de données, un flux Prep Conductor ou une connexion virtuelle se connecte exigent souvent une authentification. Si l’authentification est requise, le publicateur ou le propriétaire peut configurer le mode d’obtention des informations d’identification pour la base de données.

Sources de données

Les options de configuration de l’authentification pour les sources de données sont Inviter l’utilisateur ou Mot de passe intégré.

  • Si la source de données est définie sur « Inviter l’utilisateur », les informations d’identification pour la base de données ne sont pas stockées avec la connexion. Cela signifie qu’un utilisateur qui ouvre la source de données (ou le classeur utilisant la source de données) doit entrer ses propres informations d’identification pour la base de données afin d’accéder aux données.

  • Si une source de données est configurée avec le mot de passe intégré, les informations d’identification pour la base de données sont enregistrées avec la connexion et utilisées par toute personne qui accède à la source de données (ou l’actualise).

Pour plus d’informations, consultez Définir les informations d’identification pour accéder à vos données publiées(Le lien s’ouvre dans une nouvelle fenêtre).

Tableau Prep Conductor et connexions virtuelles

Les informations d’identification pour la base de données sont stockées dans un flux Prep ou une connexion virtuelle. Pour les flux Prep, les informations d’identification sont utilisées lors de l’exécution d’un flux Prep Conductor. Pour les connexions virtuelles, ces informations d’identification sont utilisées par toute personne qui accède à la connexion virtuelle.

Pour plus d’informations sur la gestion des informations d’identification pour les sources de données, veuillez consulter Sécurité de Data Connect.

Planification de la capacité

Plusieurs outils sont à la disposition des administrateurs pour gérer la capacité de leurs charges de travail sur Data Connect.

Les composants du service Data Connect incluent un réseau privé, des pools, des clusters et des nœuds.

Gestion des clusters

Les clusters Data Connect sont un cluster de nœuds qui accèdent aux données au sein d’un réseau privé spécifié. Ces nœuds peuvent accéder à toutes les bases de données du réseau auxquelles leur configuration leur permet d’accéder. Tous les clients Bridge sur tous les nœuds de ce cluster peuvent gérer les charges de travail de tous les sites ayant accès au cluster. Pour accroître la capacité d’un cluster, vous pouvez ajouter des nœuds au cluster afin d’améliorer le débit ou augmenter la taille de l’ordinateur (CPU, mémoire, etc.).

Équilibrage de charge avec des pools

Chaque cluster utilise un pool pour équilibrer la charge du trafic sur tous les clients Bridge du cluster. En disposant de plusieurs nœuds dans chaque cluster, vous avez l’assurance que plusieurs clients Bridge sont disponibles pour gérer le trafic associé au pool. Pour chaque domaine ajouté à un pool, toute la charge du trafic vers ce domaine est équilibré à l’échelle du cluster. Les domaines ne peuvent pas être ajoutés à plusieurs pools sur un site. Cette conception garantit que le trafic est acheminé de manière appropriée.

Limites de site

Des limites de site s’appliquent aux travaux effectués par Data Connect afin d’assurer une expérience satisfaisante à tous les clients sur Tableau Cloud. Les limites appliquées sont les mêmes que celles en vigueur pour Tableau Bridge, car Data Connect déploie Tableau Bridge en votre nom pour traiter les requêtes de base de données. Pour plus d’informations sur ces limites, consultez Capacité du site Bridge.

Pour plus d’informations sur la planification de la capacité, téléchargez le livre blanc Accéder aux données de votre réseau privé avec Tableau Cloud.