Über Data Connect
Data Connect ermöglicht Tableau Cloud-Benutzern den Zugriff auf Datenquellen in Ihrem privaten Netzwerk oder Cloud-Dienst. Data Connect funktioniert nach dem Modell der geteilten Verantwortung. Bei diesem Modell stellen Kunden die physischen oder virtuellen Rechenressourcen bereit und Tableau hostet und verwaltet den Data Connect Kubernetes-Cluster auf diesen Ressourcen.
In Ihrer Umgebung überwacht der Data Connect Kubernetes-Cluster eine Reihe von Docker-Containern. Die Container unterstützen die Laufzeitumgebung, die aus einem oder mehreren Bridge-Clients besteht. Der Bridge-Client ist das Programm, das Aufgaben ausführt und eine sichere Kommunikation über die Firewall hinweg zwischen Ihren Organisationen ermöglicht.
Zu den Data Connect-Diensten gehören:
Clusterüberwachung und Fehlerbehebung: Tableau überwacht die Integrität und die Nutzung des Bridge-Clients. Telemetriedaten werden erfasst, um sicherzustellen, dass die Ressourcen möglichst effektiv und effizient genutzt werden.
Clusterwartung: Upgrades werden automatisch bereitgestellt und der Betrieb sowie die Wartung des Clusters werden vollständig von Tableau durchgeführt. Data Connect optimiert die Bereitstellung für Ihre Arbeitslast automatisch, basierend auf den Anforderungen und dem verfügbaren Computerpool.
Alarmüberwachung: Ein kontinuierliches Vorfallmanagement sorgt dafür, dass Probleme schnell gelöst werden und die Auswirkungen auf das Geschäft begrenzt bleiben.
Connector-Unterstützung
Data Connect unterstützt dieselben Connectoren wie Tableau Bridge für Linux. Eine vollständige Übersicht über Konnektivitätsoptionen finden Sie unter Konnektivität mit Bridge.
Umgebungsunterstützung
Data Connect unterstützt derzeit lokale und VCP-Umgebungen: Amazon Web Services (AWS), Microsoft Azure und Google Cloud Platform (GCP). Data Connect-Knoten sind mit einer einzelnen Tableau Cloud-Site kompatibel. Knoten müssen im selben Netzwerk wie die Daten installiert sein. Daher sollten Kunden mindestens drei Knoten pro privatem Netzwerk einplanen, um die Verfügbarkeit des Dienstes aufrecht zu erhalten. Data Connect-Knoten müssen für Data Connect dediziert sein. Sie können keine anderen Container in dem Tableau-eigenen Cluster bereitstellen. Und Sie können keinen vorhandenen Cluster für Data Connect verwenden.
Die Data Connect-Architektur besteht aus drei Hauptkomponenten und Verantwortungsgrenzen. Auch wenn es einige Überschneidungen gibt, ist Tableau primär für die Anwendungs- und Orchestrierungsebenen verantwortlich, während die Kunden für die Infrastruktur (Rechner, Betriebssystem, Netzwerk und Speicher) und deren Standort verantwortlich sind.
Tableau Cloud kommuniziert mit dem Kubernetes-Orchestrierungsdienst, um die Kubernetes-Orchestrierung bereitzustellen, zu überwachen und zu verwalten.
Wenn Sie Data Connect initialisieren, wird eine sichere Verbindung mit dem Orchestrierungsanbieterdienst über Port 443 hergestellt.
Nachdem der Dienst konfiguriert ist, stellt ein Kubernetes-Cluster einen oder mehrere Container mit Bridge-Clients bereit. Diese Bridge-Clients sind für die Ausführung von Tableau-Workloads verantwortlich.
Tableau Cloud-Benutzer melden sich bei Tableau Cloud an, um mit dem Data Connect-Dienst zu interagieren.
Beim Einrichten initialisieren Bridge-Clients eine Verbindung mit Tableau Cloud über HTTPS. Nach erfolgreichem Verbindungsaufbau initiieren Bridge Clients über eine WebSocket-Verbindung (wss://) eine sichere, bidirektionale Kommunikation mit Ihrer Tableau Cloud-Umgebung.
Von Tableau Cloud initiierte Abfragen werden in Ihrer Datenbank ausgeführt und ermöglichen so eine Analyse durch die Endbenutzer.
Sicherheit
Informationen dazu finden Sie unter Data Connect-Sicherheit.
Data Connect-Komponenten
Die primäre Komponente der Data Connect-Lösung ist ein Cluster. Der Cluster ist ein Kubernetes-Cluster, der aus einem oder mehreren Knoten besteht. Jeder Kubernetes-Knoten hostet mindestens einen Container, welcher wiederum den Bridge-Client hostet. Der Bridge-Client führt Live- und Extraktabfragen durch.
Ein Pool ist eine logische Gruppierung von Netzwerkregeln, die angeben, welche Cluster bestimmte Abfragen ausführen sollen. Im Kontext der Bereitstellungsplanung hostet ein Pool eine Sammlung von Endpunkten (Domänen oder IP-Adressen) zwecks Lastenausgleich. Zu Domänen gehören Private-Cloud-Daten, relationale Daten, Dateidaten usw.
Um einem Cluster den Zugriff auf Datenquellen und deren Aktualisierung zu ermöglichen, wird jeder Pool einem Cluster zugewiesen. Um die Last zu verteilen, können Sie einem Cluster mehrere Pools hinzufügen.
Bereitstellung – Übersicht
Führen Sie als Erstes auf jedem Ihrer Linux-Server ein Skript aus. Dieses Skript konfiguriert einen von Tableau verwalteten Kubernetes-Cluster in Ihrer Umgebung. Der Kubernetes-Cluster wird von Tableau verwaltet.
Nachdem Kubernetes konfiguriert ist, stellen Sie einen Docker-Container in dem Cluster bereit. Tableau wird dann den Bridge-Client in dem Container bereitstellen und remote verwalten. Nachdem diese Konfiguration mit Tableau eingerichtet ist, ordnen Sie Verbindungen zu Ihren privaten Netzwerkdatenquellen zu.
Für weitere Informationen über das Bereitstellen von Data Connect laden Sie bitte das folgende Whitepaper herunter: Accessing Your Private Network Data with Tableau Cloud - Best Practices for Data Connect and Tableau Bridge(Link wird in neuem Fenster geöffnet) (Zugreifen auf Ihre privaten Netzwerkdaten mit Tableau Cloud – Best Practices für Data Connect und Tableau Bridge).
Datenbankkonnektivität
Abfragen werden von dem Bridge-Client in dem Cluster verwaltet. Ihre Daten werden direkt von dem Bridge-Client an Tableau Cloud übertragen. Data Connect erfordert keinen externen Netzwerkzugriff, keine Firewall-Lücken und keinen Remote-Computerzugriff.
Der Bridge-Client stellt über sichere WebSockets (wss://) eine dauerhafte Verbindung zu dem Tableau Cloud-Data Connect-Dienst her. Dann wartet der Client auf eine Anfrage von Tableau Cloud.
- Bei Datenquellen mit Direkt- oder virtuellen Verbindungen initiiert Tableau Cloud eine Abfrage an den Bridge-Client.
- Bei Datenquellen mit einer Extraktverbindung, die Aktualisierungszeitpläne verwenden, erhält der Client die Aktualisierungszeitplan-Anfrage und kontaktiert Tableau Cloud über eine sichere Verbindung (https://) für die Datenquelldateien (.tds).
Der Bridge-Client stellt eine Verbindung zu den privaten Netzwerkdaten her, wobei er die Anmeldeinformationen verwendet, die in der Auftragsanforderung enthalten sind.
Die Datenbank gibt die Ergebnisse der Abfrage zurück.
Der Bridge-Client empfängt die Nutzlast und gibt sie an den Data Connect-Dienst zurück.