Informazioni su Data Connect

Data Connect consente agli utenti di Tableau Cloud di accedere alle origini dati sulla rete privata o sul servizio cloud. Data Connect funge da modello di responsabilità condivisa. Con questo modello, i clienti forniscono le risorse di elaborazione fisiche o virtuali e Tableau ospita e gestisce il cluster Kubernetes Data Connect su tali risorse.

Nel tuo ambiente il cluster Kubernetes Data Connect controlla un insieme di contenitori. I contenitori supportano l’ambiente runtime costituito da uno o più client Bridge. Il client Bridge è il programma che esegue attività e consente comunicazioni sicure tramite il firewall nell’ambito dell’organizzazione.

I servizi di Data Connect includono:

  • Monitoraggio e risoluzione dei problemi relativi ai cluster: Tableau monitora l’integrità e l’utilizzo del client Bridge. Vengono raccolti dati di telemetria per garantire che le risorse siano utilizzate nel modo più efficace ed efficiente.

  • Manutenzione dei cluster: gli aggiornamenti vengono distribuiti automaticamente e il funzionamento e la manutenzione dei cluster sono di competenza di Tableau, che li esegue completamente. Data Connect ottimizza automaticamente la distribuzione per il tuo carico di lavoro in base alle esigenze e al pool di elaborazione disponibile.

  • Monitoraggio degli avvisi: la gestione degli incidenti è sempre disponibile per risolvere rapidamente i problemi e limitare l’impatto sulle attività aziendali.

Supporto del connettore

Data Connect supporta gli stessi connettori supportati da Tableau Bridge per Linux. Per una revisione completa delle opzioni di connettività, fai riferimento a Connettività con Bridge.

Supporto ambientale

Data Connect supporta attualmente ambienti locali e VCP: Amazon Web Services (AWS), Microsoft Azure e Google Cloud Platform (GCP). I nodi Data Connect sono compatibili con un singolo sito Tableau Cloud. I nodi devono essere installati nella stessa rete dei dati. Pertanto i clienti dovrebbero pianificare almeno tre nodi per rete privata per garantire la disponibilità del servizio. I nodi Data Connect devono essere dedicati a Data Connect. Non è possibile distribuire altri contenitori nel cluster di proprietà di Tableau. Inoltre, non è possibile utilizzare un cluster esistente per Data Connect.

Architettura

L’architettura di Data Connect è costituita da tre componenti principali e prevede limiti di responsabilità. Sebbene esista una certa sovrapposizione, Tableau è principalmente responsabile dei livelli applicazione e orchestrazione, mentre i clienti sono responsabili dell’infrastruttura (elaborazione, sistema operativo, rete e archiviazione) e della relativa ubicazione.

  1. Tableau Cloud comunica con il servizio di orchestrazione Kubernetes per distribuire, monitorare e gestire l'orchestrazione Kubernetes.

  2. Quando inizializzi Data Connect, viene stabilita una connessione sicura con il servizio del provider di orchestrazione tramite la porta 443.

  3. Dopo aver configurato il servizio, un cluster Kubernetes distribuisce uno o più contenitori con uno o più client Bridge. Questi client Bridge saranno responsabili dell'esecuzione dei carichi di lavoro di Tableau.

  4. Gli utenti di Tableau Cloud accedono a Tableau Cloud per interagire con il servizio Data Connect.

  5. Durante la configurazione, i client Bridge inizializzano una connessione con Tableau Cloud tramite HTTPS. Dopo l’avvenuta connessione, il client Bridge avvia una comunicazione bidirezionale sicura con l’ambiente Tableau Cloud utilizzando una connessione WebSocket (wss://).

  6. Le query avviate da Tableau Cloud vengono eseguite sul tuo database per supportare l'analisi dell'utente finale.

Sicurezza

Consulta Data Connect.

Componenti di Data Connect

Il componente principale della soluzione Data Connect è un cluster. Si tratta di un cluster Kubernetes composto da uno o più nodi. Ogni nodo Kubernetes ospita almeno un contenitore, che a sua volta ospita il client Bridge. Il client Bridge esegue query live e di estrazione.

Un pool è un raggruppamento logico di regole di rete che specificano quali cluster devono completare query specifiche. Nel contesto della pianificazione della distribuzione, un pool ospita una raccolta di endpoint (domini o indirizzi IP) ai fini del bilanciamento del carico. I domini includono dati cloud privati, dati relazionali, dati di file, ecc.

Per consentire a un cluster di accedere e aggiornare le origini dati, ogni pool viene assegnato a un cluster. Per distribuire il carico, è possibile aggiungere più pool a un cluster.

Panoramica della distribuzione

Per iniziare, esegui uno script su ciascuno dei tuoi server Linux. Questo script configura un cluster Kubernetes gestito da Tableau nel tuo ambiente. Il cluster Kubernetes è gestito da Tableau.

Dopo aver configurato Kubernetes, è necessario distribuire un contenitore Docker nel cluster. Quindi Tableau distribuirà e gestirà in remoto il client Bridge all’interno del contenitore. Dopo aver stabilito questa configurazione con Tableau, potrai mappare le connessioni alle origini dati della tua rete privata.

Per ulteriori informazioni sulla distribuzione di Data Connect, scarica il white paper Accessing Your Private Network Data with Tableau Cloud - Best Practices for Data Connect and Tableau Bridge(Il collegamento viene aperto in una nuova finestra).

Connettività del database

Le query vengono gestite dal client Bridge nel cluster. I tuoi dati vengono trasmessi direttamente dal client Bridge a Tableau Cloud. Data Connect non richiede accesso alla rete esterna, porte aperte nel firewall o accesso a computer remoti.

  1. Il client Bridge stabilisce una connessione persistente al servizio Data Connect di Tableau Cloud tramite WebSocket sicuri (wss://). Il client attende quindi una richiesta da Tableau Cloud.

    • Per le origini dati con connessioni live o virtuali, Tableau Cloud invia una query al client Bridge.
    • Per le origini dati con connessione di estrazione che utilizzano pianificazioni di aggiornamento, il client riceve la richiesta di pianificazione di aggiornamento e contatta Tableau Cloud utilizzando una connessione sicura (https://) per i file di origine dati (.tds).
  2. Il client Bridge si connette quindi ai dati della rete privata utilizzando le credenziali incluse nella richiesta di processo.

  3. Il database restituisce i risultati della query.

  4. Il client Bridge riceve il payload e lo restituisce al servizio Data Connect.