Pianificare la distribuzione di Data Connect
Data Connect è un servizio in abbonamento a pagamento disponibile per i clienti di Tableau Cloud Enterprise e Tableau+. Dopo aver acquistato Data Connect, l’amministratore del sito potrà configurare il servizio nella pagina delle impostazioni di Tableau Cloud.
Specifiche dell’infrastruttura
Elaborazione: posizione per l’hosting di Data Connect. Può essere un sistema bare metal o una VM e può trovarsi in una rete privata o nel cloud.
Sistema operativo (SO): installazione aggiornata e con patch di una distribuzione Linux supportata.
Archiviazione: spazio di archiviazione allocato per ospitare il sistema operativo, Data Connect e le estrazioni create durante l’esecuzione degli aggiornamenti.
Rete: il computer deve essere in grado di connettersi all’origine dati e a due posizioni nella rete Internet pubblica.
Specifiche dei nodi
Numero di nodi | Carico di lavoro di produzione minimo: tre nodi per rete Carico di lavoro minimo di sviluppo/test: un nodo per rete |
vCPU | Minimo: 8 vCPU Consigliato: almeno 16 vCPU |
Memoria | Minimo: 16 GB Consigliato: almeno 64 GB |
Archiviazione (a due dischi) Importante: il disco secondario deve essere vuoto e non formattato. | Disco principale Disco secondario |
Autorizzazione | Accesso root all’host |
Sistema operativo Linux
Distribuzioni supportate | RHEL-8 RHEL-9 Ubuntu-20.04 Ubuntu-22.04 |
Specifiche di rete
Per ulteriori informazioni sulle relazioni dei componenti di Data Connect, consulta Architettura.
Filtro del proxy | Consulta Filtro del proxy di inoltro facoltativo. |
Comunicazione bidirezionale con Tableau Cloud sulla porta 443 (livello applicazione) | L’intervallo di indirizzi IP è univoco per ogni pod Tableau Cloud. Per determinare l’intervallo di indirizzi IP, consulta Autorizzare l’accesso ai dati cloud pubblicati su Tableau Cloud(Il collegamento viene aperto in una nuova finestra). |
Richieste in uscita per la convalida della certificazione sulla porta 80 (livello applicazione) | |
Autenticazione client TLS in uscita sulla porta 443 con autenticazione TLS reciproca (livello orchestrazione) | 52.42.211.235 52.10.6.79 35.167.70.143 |
Elenco in uscita dei nomi di dominio completi (FQDN) (livello orchestrazione) | tunnel.rafay-edge.net api.rafay.dev control.rafay.dev fluentd-aggr.rafay-edge.net influxdb01.core.rafay-edge.net debug.core.rafay-edge.net edge.core.rafay-edge.net registry.rafay-edge.net app.rafay.dev console.rafay.dev *.connector.kubeapi-proxy.rafay.dev *.user.kubeapi-proxy.rafay.dev event.core.rafay-edge.net repo.rafay-edge.net *.connector.cdrelay.rafay.dev *.user.cdrelay.rafay.dev *.connector.infrarelay.rafay.dev *.user.infrarelay.rafay.dev |
Rete interna | I nodi del cluster avranno bisogno dello stesso accesso di rete all’origine dati richiesto da Tableau Desktop. |
Autorizzazioni di Tableau Cloud | Ruolo amministratore del sito e credenziali per accedere all’origine dati. |
Origine dati | Un metodo di autenticazione per l’origine dati attualmente supportato da Data Connect e accessibile alla rete dal cluster. |
Accesso ai database
Data Connect utilizza i connettori Tableau per connettersi a database diversi al fine di garantire l’aggiornamento dei dati. Alcuni di questi connettori richiedono driver per comunicare con i database. Per ottenere i driver per i connettori supportati da Data Connect, visita la pagina di download dei driver di Tableau e filtra in base a Linux. Data Connect supporta solo driver Linux. Assicurati di seguire le istruzioni elencate per ciascun database.
Autenticazione dei database
I dati sottostanti a cui si connette un’origine dati, un flusso di Tableau Prep Conductor o una connessione virtuale spesso richiedono l’autenticazione. Se è necessaria l’autenticazione, il Publisher o il proprietario può specificare come ottenere le credenziali database.
Origini dati
Le opzioni di configurazione dell’autenticazione per le origini dati sono: Avvisa utente o Password incorporata.
Se l’origine dati è impostata su Avvisa utente, le credenziali database non vengono archiviate con la connessione. Ciò significa che un utente che apre l’origine dati (o la cartella di lavoro che utilizza l’origine dati) deve immettere le proprie credenziali database per accedere ai dati.
Se un’origine dati è impostata con la password incorporata, le credenziali database vengono salvate con la connessione e utilizzate da chiunque acceda all’origine dati (o aggiorna l’origine dati).
Per maggiori informazioni, consulta Impostare credenziali per l’accesso ai dati pubblicati(Il collegamento viene aperto in una nuova finestra).
Tableau Prep Conductor e connessioni virtuali
Le credenziali database vengono memorizzate in un flusso di Prep o in una connessione virtuale. Per i flussi di Prep le credenziali vengono utilizzate quando viene eseguito un flusso di Prep Conductor. Per le connessioni virtuali queste credenziali vengono utilizzate da chiunque acceda alla connessione virtuale.
Per maggiori informazioni sulla gestione delle credenziali dell’origine dati, consulta Data Connect.
Pianificazione della capacità
Gli amministratori hanno a disposizione diversi strumenti per gestire la capacità dei propri carichi di lavoro in Data Connect.
Gestione dei cluster
I cluster Data Connect sono un cluster di nodi che accedono ai dati all’interno di una rete privata specificata. Tali nodi possono accedere a tutti i database all’interno della propria rete per i quali sono stati configurati. Tutti i client Bridge su tutti i nodi del cluster possono gestire i carichi di lavoro per tutti i siti che hanno accesso al cluster. Per aumentare la capacità di un cluster, è possibile aggiungere nodi al cluster per aumentare la velocità effettiva o aumentare le dimensioni del computer (CPU, memoria e così).
Bilanciamento del carico con i pool
Ogni cluster utilizza un pool per bilanciare il carico del traffico tra tutti i client Bridge nel cluster. La presenza di più nodi all’interno di ciascun cluster garantisce la disponibilità di più client Bridge per gestire il traffico associato al pool. Per ogni dominio aggiunto a un pool, tutto il traffico verso quel dominio viene bilanciato sul cluster. Non è possibile aggiungere domini a più di un pool in un sito. Questa progettazione garantisce che il traffico venga instradato in modo appropriato.
Limiti del sito
Per garantire un’esperienza ottimale a tutti i clienti su Tableau Cloud, sono previsti limiti del sito per i processi forniti da Data Connect. I limiti applicati sono gli stessi di quelli applicati per Tableau Bridge, perché Data Connect distribuisce Tableau Bridge per tuo conto per gestire le query sul database. Per maggiori informazioni su tali limiti, consulta Capacità del sito Bridge.
Per maggiori informazioni sulla pianificazione della capacità, scarica il white paper relativo all’accesso ai dati della tua rete privata con Tableau Cloud (in inglese).