Über Data Connect
Data Connect ermöglicht Tableau Cloud-Benutzern den Zugriff auf Datenquellen in Ihrem privaten Netzwerk oder Cloud-Dienst. Data Connect funktioniert nach dem Modell der geteilten Verantwortung. Bei diesem Modell stellen Kunden die physischen oder virtuellen Rechenressourcen bereit und Tableau hostet und verwaltet den Data Connect Kubernetes-Cluster auf diesen Ressourcen.
In Ihrer Umgebung überwacht der Data Connect Kubernetes-Cluster eine Reihe von Docker-Containern. Die Container unterstützen die Laufzeitumgebung, die aus einem oder mehreren Agenten besteht. Der Agent ist das Programm, das Aufgaben ausführt und eine sichere Kommunikation über die Firewall hinweg zwischen Ihren Organisationen ermöglicht.
Zu den Data Connect-Diensten gehören:
Clusterüberwachung und Fehlerbehebung: Tableau überwacht den Zustand und die Nutzung des Data Connect-Agenten. Telemetriedaten werden erfasst, um sicherzustellen, dass die Ressourcen möglichst effektiv und effizient genutzt werden.
Clusterwartung: Upgrades werden automatisch bereitgestellt und der Betrieb sowie die Wartung des Clusters werden vollständig von Tableau durchgeführt. Data Connect optimiert die Bereitstellung für Ihre Arbeitslast automatisch, basierend auf den Anforderungen und dem verfügbaren Computerpool.
Alarmüberwachung: Ein kontinuierliches Vorfallmanagement sorgt dafür, dass Probleme schnell gelöst werden und die Auswirkungen auf das Geschäft begrenzt bleiben.
Connector-Unterstützung
Data Connect unterstützt dieselben Connectoren wie Tableau Bridge für Linux. Eine vollständige Übersicht über Konnektivitätsoptionen finden Sie unter Konnektivität mit Bridge.
Umgebungsunterstützung
Data Connect unterstützt derzeit lokale und VCP-Umgebungen: Amazon Web Services (AWS), Microsoft Azure und Google Cloud Platform (GCP). Data Connect-Knoten sind mit einer einzelnen Tableau Cloud-Site kompatibel. Knoten müssen im selben Netzwerk wie die Daten installiert sein. Daher sollten Kunden mindestens drei Knoten pro privatem Netzwerk und Site einplanen, um die Verfügbarkeit des Dienstes aufrecht zu erhalten. Data Connect-Knoten müssen für Data Connect dediziert sein. Sie können keine anderen Container in dem Tableau-eigenen Cluster bereitstellen. Und Sie können keinen vorhandenen Cluster für Data Connect verwenden.
Architektur
Die Data Connect-Architektur besteht aus drei Hauptkomponenten und Verantwortungsgrenzen. Auch wenn es einige Überschneidungen gibt, ist Tableau primär für die Anwendungs- und Orchestrierungsebenen verantwortlich, während die Kunden für die Infrastruktur (Rechner, Betriebssystem, Netzwerk und Speicher) und deren Standort verantwortlich sind.
Tableau Cloud → Orchestrierungsdienst
Kubernetes-Cluster → Orchestrierungsdienst
Kubernetes-Cluster → Container
Tableau-Benutzer → Tableau Cloud
Data Connect-Agent (Container) → Tableau Cloud
Data Connect-Agent (Container) → Kundendatenbank
Sicherheit
Informationen dazu finden Sie unter Data Connect-Sicherheit.
Data Connect-Komponenten
Die primäre Komponente der Data Connect-Lösung ist ein Cluster. Der Cluster ist ein Kubernetes-Cluster, der aus einem oder mehreren Knoten besteht. Jeder Kubernetes-Knoten hostet mindestens einen Container, welcher wiederum den Data Connect-Agenten hostet. Agenten führen Live- und Extraktabfragen durch.
Ein Pool ist eine logische Gruppierung von Netzwerkregeln, die angeben, welche Cluster bestimmte Abfragen ausführen sollen. Im Kontext der Bereitstellungsplanung hostet ein Pool eine Sammlung von Endpunkten (Domänen oder IP-Adressen) zwecks Lastenausgleich. Zu Domänen gehören Private-Cloud-Daten, relationale Daten, Dateidaten usw.
Um einem Cluster den Zugriff auf Datenquellen und deren Aktualisierung zu ermöglichen, wird jeder Pool einem Cluster zugewiesen. Um die Last zu verteilen, können Sie einem Cluster mehrere Pools hinzufügen.
Bereitstellung – Übersicht
Führen Sie als Erstes auf jedem Ihrer Linux-Server ein Skript aus. Dieses Skript konfiguriert einen von Tableau verwalteten Kubernetes-Cluster in Ihrer Umgebung. Der Kubernetes-Cluster wird von Tableau verwaltet.
Nachdem Kubernetes konfiguriert ist, stellen Sie einen Docker-Container in dem Cluster bereit. Tableau wird dann den Data Connect-Agenten in dem Container bereitstellen und remote verwalten. Nachdem diese Konfiguration mit Tableau eingerichtet ist, ordnen Sie Verbindungen zu Ihren privaten Netzwerkdatenquellen zu.
Datenbankkonnektivität
Abfragen werden von dem Data Connect-Agenten im Cluster verwaltet. Ihre Daten werden direkt vom Data Connect-Agenten an Tableau Cloud übertragen. Data Connect erfordert keinen externen Netzwerkzugriff, keine Firewall-Lücken und keinen Remote-Computerzugriff.
Der Agent stellt über sichere WebSockets (wss://) eine dauerhafte Verbindung zum Tableau Cloud Data Connect-Dienst her. Dann wartet der Client auf eine Anfrage von Tableau Cloud.
- Für Datenquellen mit Live- oder virtuellen Verbindungen initiiert Tableau Cloud eine Abfrage an den Data Connect-Agenten.
- Bei Datenquellen mit einer Extraktverbindung, die Aktualisierungszeitpläne verwenden, erhält der Client die Aktualisierungszeitplan-Anfrage und kontaktiert Tableau Cloud über eine sichere Verbindung (https://) für die Datenquelldateien (.tds).
Der Agent stellt dann eine Verbindung zu den privaten Netzwerkdaten her, indem er die Anmeldeinformationen verwendet, die in der Auftragsanfrage enthalten sind.
Die Datenbank gibt die Ergebnisse der Abfrage zurück.
Der Data Connect-Agent empfängt die Nutzlast und gibt sie an den Data Connect-Dienst zurück.