Tableau Data Management
Questo contenuto fa parte di Tableau Blueprint, un framework di valutazione della maturità che ti consente di approfondire e migliorare l’utilizzo dei dati nella tua organizzazione per aumentarne un impatto. Per iniziare il tuo percorso, esegui la valutazione(Il collegamento viene aperto in una nuova finestra).
Tableau Data Management ti aiuta a gestire meglio i dati nel tuo ambiente di analisi, per prendere sempre decisioni sulla base di dati attendibili e aggiornati. Dalla preparazione dei dati alla catalogazione, fino alla ricerca e alla governance, Tableau Data Management aumenta l’affidabilità dei dati, accelerando il passaggio all’analisi self-service. Offre una raccolta di funzioni e funzionalità con licenza separata, tra cui Tableau Prep Conductor e Tableau Catalog, che consentono di gestire i contenuti e le risorse di dati di Tableau in Tableau Server e Tableau Cloud.
Che cos’è Tableau Data Management?
In generale, la tua organizzazione trarrà vantaggio dalle strategie di governance dei dati e di gestione delle origini dati illustrate in altre parti di Tableau Blueprint. Al di là di queste metodologie, spesso si sentono riferimenti generici al termine data management nelle community che si occupano di database, analisi dei dati e visualizzazione. Tuttavia, questo termine diventa più specifico quando si parla di Tableau con Tableau Data Management, un insieme di funzionalità aggiuntive a pagamento da utilizzare con Tableau Server e Tableau Cloud. Sia che tu utilizzi Tableau Server per Windows o Linux oppure Tableau Cloud, le funzionalità di Tableau Data Management sono per lo più identiche (un piccolo sottoinsieme di funzionalità può essere disponibile solo in Tableau Cloud o in Tableau Server).
Tableau Data Management comprende un insieme di strumenti che aiutano amministratori e analisti dei dati della tua organizzazione a gestire i contenuti e le risorse relative ai dati nell’ambiente Tableau. In particolare, acquistando Tableau Data Management vengono aggiunti tre insiemi di funzionalità aggiuntive:
Tableau Catalog
Tableau Prep Conductor
Connessioni virtuali con criteri dati
Tableau Catalog
Tableau Catalog, il componente originale di Tableau Data Management, offre funzionalità utili per semplificare l’accesso, la comprensione e l’affidabilità delle origini dati di Tableau. Concentrandosi su aree come la derivazione, la qualità dei dati, la ricerca e l’analisi dell’impatto, Tableau Catalog consente agli amministratori dei dati e ai visualizzatori/analisti dei dati di comprendere e ritenere affidabili le origini dati in Tableau Server e Cloud. Tableau Catalog include funzionalità aggiuntive per gli sviluppatori di Tableau tramite metodi di metadati nell’API REST di Tableau.
La prima volta che viene abilitato, Tableau Catalog scansiona tutti gli elementi di contenuto correlati presenti nel tuo sito Tableau Server o Cloud per creare una vista connessa di tutti gli oggetti correlati (in Tableau Catalog si parla di metadati di contenuto). In questo modo si espandono le funzionalità di ricerca oltre le semplici connessioni dati. Gli amministratori dei dati e gli autori di visualizzazioni possono effettuare ricerche anche in base a colonne, database e tabelle.
Per limitare la possibilità di modificare o eliminare inavvertitamente un oggetto da cui dipende un altro oggetto (ad esempio, rinominando o rimuovendo una colonna del database che è fondamentale per una cartella di lavoro di produzione), la funzionalità di derivazione di Tableau Catalog espone le interrelazioni tra tutti i contenuti di un sito Tableau, compresi metriche, flussi e connessioni virtuali. Ora è possibile vedere facilmente le relazioni tra gli oggetti e analizzare l’impatto di una modifica in corso prima di effettuarla.
Per migliorare il livello di attendibilità delle tue origini dati di Tableau, Tableau Catalog fornisce informazioni supplementari, tra cui le descrizioni estese degli oggetti correlati ai dati, la vista Dettagli sui dati e i tag delle parole chiave per una ricerca ancor più flessibile. Quando si certificano le origini dati, queste vengono contrassegnate da un’icona per indicare che il proprietario o l’amministratore le considera attendibili. Gli elementi dati (origini dati, colonne e così via) che possono destare preoccupazione per gli utilizzatori, come i dati deprecati o inutilizzati, possono essere contrassegnati da avvisi sulla qualità dei dati. Oltre a un avviso sulla qualità dei dati, i dati sensibili possono essere contrassegnati in modo specifico con etichette della sensibilità.
Tableau Prep Conductor
Se sei come molti clienti di Tableau, hai scoperto i vantaggi di Tableau Prep Builder per creare sofisticati “flussi” di preparazione dei dati che combinano più origini dati, modellano i dati, personalizzano le colonne e generano uno o più formati di dati desiderati. Ma una volta creato il flusso di Prep perfetto, come si fa ad automatizzarlo e ad aggiornare completamente o in modo incrementale le origini dati in base a una pianificazione?
È qui che entra in gioco Tableau Prep Conductor, un’altra funzionalità di Data Management. Con Tableau Prep Conductor è possibile pianificare in modo flessibile i flussi di Tableau Prep, indipendentemente dal fatto che siano stati pubblicati nel tuo ambiente Tableau Server o Tableau Cloud da Tableau Prep Builder o creati direttamente in un browser con il Web authoring dei flussi di Prep. Per iniziare, testa il tuo flusso basato sul Web. Puoi eseguire i flussi manualmente su richiesta senza Data Management, ma dovrai acquistare Data Management per pianificare i flussi da eseguire automaticamente con Prep Conductor. Prima della pianificazione, il flusso deve essere eseguito fino al completamento e creare l’origine dati desiderata senza errori.
Se utilizzi Tableau Server, l’amministratore (o tu stesso, se disponi dei privilegi necessari) può creare delle pianificazioni personalizzate (come “Tutti i giorni a mezzanotte”, “Domenica a mezzogiorno” e così via) per eseguire i flussi di Prep, proprio come hai fatto per gli aggiornamenti delle estrazioni.
Se utilizzi Tableau Cloud, per impostazione predefinita verrà installato un insieme di pianificazioni predefinite del flusso di Prep. Non è possibile personalizzare queste pianificazioni o creare un proprio flusso di Prep.
Pianifica i flussi da eseguire dal menu Azioni. Una pianificazione Attività singola eseguirà solo il flusso di preparazione selezionato nella pianificazione scelta. Una pianificazione Attività collegata ti consentirà di selezionare uno o più flussi aggiuntivi da eseguire in sequenza con il flusso selezionato, nel caso in cui tu voglia “concatenare” più flussi da eseguire in un ordine specifico (magari per creare un’origine dati di output da utilizzare come origine dati di input per un flusso successivo). I flussi verranno ora eseguiti quando pianificati, aggiornando o creando automaticamente le origini dati su cui possono basarsi le cartelle di lavoro Tableau.
Oltre alla possibilità di pianificare i flussi, Data Management e Tableau Prep Conductor aggiungono opzioni per monitorare i successi/insuccessi dei flussi pianificati, inviare notifiche via e-mail quando le pianificazioni dei flussi riescono o falliscono, eseguire i flussi in modo programmatico con l’API REST di Tableau Server/Cloud e beneficiare di ulteriori funzionalità della vista amministrativa per monitorare lo storico delle prestazioni dei flussi.
PROCEDURA CONSIGLIATA SUGGERITA: se hai intenzione di eseguire un numero elevato di flussi di Tableau Prep Conductor in Tableau Server, potrebbe essere necessario modificare la scalabilità del tuo ambiente server. Se necessario, ottimizza le prestazioni del tuo sistema Tableau Server aggiungendo altri nodi o processi di gestione componenti in background per soddisfare il carico del flusso di Prep richiesto.
E Tableau Cloud? Anche se non dovrai prendere in considerazione modifiche architettoniche a Tableau Cloud per gestire la capacità del flusso di Prep, dovrai acquisire un blocco di risorse (un’unità di capacità di calcolo di Tableau Cloud) per ogni flusso concorrente di Tableau Prep Conductor che desideri pianificare. Determina il numero di programmi di flusso contemporanei di cui hai bisogno e acquista i blocchi di risorse Tableau Cloud di conseguenza.
Connessioni virtuali
Passiamo alla nostra prossima funzionalità di Data Management: le connessioni virtuali. Una connessione virtuale fornisce un punto di accesso centralizzato ai dati. Può accedere a più tabelle in diversi database. Le connessioni virtuali ti consentono di gestire l’estrazione dei dati e la sicurezza in una singola posizione, a livello di connessione.
Quando sono utili le connessioni virtuali?
Se consideri il modo tradizionale di condividere una connessione a un database con più cartelle di lavoro in Tableau, probabilmente penserai che si tratta di connettersi direttamente a un server di database come SQL Server o Snowflake, fornire le credenziali di accesso al database, aggiungere e unire una o più tabelle e quindi pubblicare l’origine dati su Tableau Server o Tableau Cloud. Anche se puoi scegliere di utilizzare questa connessione come connessione live ai dati, è molto probabile che tu voglia estrarre i dati dall’origine dati per velocizzare le cartelle di lavoro collegate.
Per maggiore chiarezza, immaginiamo che questa operazione venga eseguita un certo numero di volte per gestire, ad esempio, un insieme diverso di tabelle o di join, ottenendo così più origini dati pubblicate (e magari estratte) per una serie di cartelle di lavoro che hanno requisiti diversi in termini di tabelle e join, ma che utilizzano tutte lo stesso database iniziale.
Ora, pensiamo a cosa succede se cambia qualcosa nel database iniziale di SQL Server o Snowflake a cui si fa riferimento in quell’insieme di origini dati: ad esempio, le tabelle vengono rinominate, vengono aggiunti altri campi o vengono cambiate le credenziali database. Dovrai quindi aprire tutte le origini dati create in precedenza, apportare le modifiche necessarie per adattarle al database modificato e ripubblicare (e magari ripianificare gli aggiornamenti delle estrazioni).
Potrebbe essere molto più semplice creare una sola “definizione” di connessione dati iniziale in cui sono archiviati il nome del server del database, le credenziali e i riferimenti alle tabelle. E potrebbe risultare più opportuno estrarre i dati da questa “definizione” più estesa. In seguito, quando dovrai creare diverse origini dati per varie combinazioni di tabelle, join e così via, potrai fare riferimento a quella “definizione” iniziale invece di collegarti direttamente a uno o più server di database. Se qualcosa nella struttura principale del database cambia (ad esempio, i nomi delle tabelle cambiano o le credenziali vengono modificate), è sufficiente modificare l’oggetto “definizione” iniziale e tutte le origini dati dipendenti erediteranno automaticamente le modifiche.
Questa funzionalità di “definizione” condivisa viene introdotta in Data Management tramite una connessione virtuale. Una connessione virtuale è simile a una connessione ad un’origine dati standard in quanto archivia il server del database, le credenziali di accesso e le tabelle selezionate. Inoltre, analogamente a un’origine dati tradizionale di Tableau, una connessione virtuale può contenere connessioni a più database/origini dati, ciascuna con il proprio insieme di credenziali e tabelle. Anche se alcune modifiche dei metadati sono consentite in una connessione virtuale, ad esempio nascondere o rinominare i campi, le tabelle non vengono unite tramite join all’interno della connessione virtuale. Se utilizzi la connessione virtuale come origine diretta per una cartella di lavoro o come tipo di connessione per un’ulteriore origine dati pubblicata, puoi unire le tabelle tramite join ed eseguire ulteriori personalizzazioni dell’origine dati.
Una volta che una connessione virtuale è stata creata e pubblicata su Tableau Server o Tableau Cloud e che sono state impostate le autorizzazioni appropriate, puoi connetterti alla connessione virtuale in Tableau Desktop o Tableau Server/Cloud proprio come faresti con qualsiasi altra origine dati. Tuttavia, non dovrai specificare la posizione del server di database o fornire le credenziali e potrai immediatamente unire le tabelle tramite join, nonché visualizzare i dati o pubblicare l’origine dati.
Criteri dati
Oltre alle funzionalità di connessione centralizzata al database descritte in precedenza, le connessioni virtuali di Tableau Data Management offrono anche un’opzione più semplice di sicurezza centralizzata a livello di riga con i criteri dati. Utilizza un criterio dati per applicare la sicurezza a livello di riga a una o più tabelle in una connessione virtuale. Un criterio dati filtra i dati, assicurando che gli utenti vedano solo i dati che sono autorizzati a visualizzare. I criteri dati si applicano sia alle connessioni live che a quelle di estrazione.
Quando sono utili i criteri dati?
In molte organizzazioni si tende a limitare automaticamente i dati visibili in una visualizzazione solo a quelli applicabili all’utente corrente. Ad esempio, consideriamo una dashboard condivisa che contiene i dettagli dell’ordine in un oggetto tabella a campi incrociati.
Se sei un responsabile commerciale di un territorio vasto, la tabella a campi incrociati dei dettagli mostrerà gli ordini di tutti gli account executive del tuo territorio.
Se invece, sei un singolo account executive, la tabella a campi incrociati mostrerà solo gli ordini relativi ai tuoi account.
Questo scenario richiede l’implementazione della sicurezza a livello di riga nel tuo ambiente Tableau, che può essere realizzata con uno dei seguenti metodi:
Sicurezza a livello riga nel database. Ogni volta che si visualizza una visualizzazione, all’utente viene richiesto di accedere al database sottostante con le proprie credenziali oppure le credenziali vengono ereditate dall’account utente di Tableau. L’insieme di dati risultante è limitato ai soli dati che sono autorizzati a vedere in base alle credenziali fornite. Non solo questa procedura può diventare presto pesante, dato che ogni utente deve gestire le proprie credenziali, ma la connessione dati live può avere un impatto sulle prestazioni, gravando sul database sottostante. Inoltre, alcune opzioni per il passaggio delle credenziali alle connessioni live possono risultare limitate con Tableau Cloud.
Filtri utente di Tableau. I filtri utente vengono applicati quando si creano singoli fogli di lavoro all’interno di una cartella di lavoro. Specificando le combinazioni di credenziali di singoli utenti Tableau o l’appartenenza a uno o più gruppi di utenti Tableau, è possibile filtrare i singoli fogli di lavoro per visualizzare solo i dati relativi a quell’utente. Questa operazione può diventare laboriosa, in quanto ogni singolo foglio di lavoro all’interno di una cartella di lavoro richiede l’inserimento di filtri utente. Non c’è infatti modo di specificare un filtro utente su un vasto gruppo di cartelle di lavoro con un’unica procedura. Inoltre, se un utente riceve inavvertitamente le autorizzazioni di modifica della cartella di lavoro, può facilmente trascinare il filtro utente dallo spazio Filtri e vedere tutti i dati sottostanti che non è autorizzato a visualizzare.
Utilizzando un sottoinsieme del linguaggio di calcolo di Tableau, i criteri dati possono specificare regole sofisticate (magari utilizzando una “tabella dei diritti” in un database) per personalizzare e limitare i dati restituiti dalla connessione virtuale, in base all’ID utente o all’appartenenza a un gruppo. In questo modo non solo si garantisce la sicurezza a livello di riga dell’origine dati (tutte le cartelle di lavoro collegate all’origine dati erediteranno automaticamente la sicurezza e adotteranno le modifiche apportate all’interno della connessione virtuale), ma si aggiunge un ulteriore livello di sicurezza limitando la modifica dei criteri dei dati solo a coloro che dispongono delle autorizzazioni di modifica per la connessione virtuale originale.