Pianificare l’origine dati
Al centro di Tableau ci sono i tuoi dati. Il livello di successo nell’esplorazione dei dati, nella risposta alle domande e nella creazione di visualizzazioni per te stesso o per altri utenti dipende dai dati sottostanti.
Se il tuo obiettivo è eseguire qualche esplorazione rapida o effettuare analisi ad hoc, potrebbe essere sufficiente connetterti ad alcuni dati, trascinare e rilasciare alcuni elementi per creare delle viste e ottenere le informazioni necessarie. Se invece il tuo obiettivo è creare un’origine dati o un’analisi che verrà utilizzata più di una volta, è consigliabile esaminare e pianificare l’origine dati.
Origini dati di Tableau
Un’origine dati di Tableau è il collegamento tra i dati di origine e Tableau. Si tratta essenzialmente della somma dei tuoi dati (come connessione live o estrazione), delle informazioni di connessione, dei nomi delle tabelle o dei fogli che contengono i dati e delle personalizzazioni eseguite sui dati per utilizzare l’origine dati in Tableau. Tali personalizzazioni includono elementi quali la modalità di combinazione dei dati e metadati come calcoli, campi rinominati e formattazione predefinita.
Un’origine dati di Tableau può contenere più connessioni dati a diversi database o file. Le informazioni di connessione includono la posizione dei dati, ad esempio il nome e il percorso di un file o una posizione in rete, e i dettagli su come connettersi ai dati, ad esempio il nome del server di database e le informazioni di accesso al server.
Nota: i termini origine dati e connessione dati sono stati utilizzati indiscriminatamente in passato e potrebbero non essere chiaramente distinti nei materiali precedenti.
È anche importante tenere presente la differenza tra l’origine dati di Tableau (l’accesso di Tableau ai dati e tutte le personalizzazioni che possono essere coinvolte) e i dati di origine stessi (ad esempio, un database o un foglio di calcolo di Excel). La pianificazione di un’origine dati nel senso della progettazione di un database non rientra nell’ambito di questo argomento.
Le origini dati di Tableau possono rimanere incorporate nella cartella di lavoro in cui sono state create originariamente oppure possono essere pubblicate separatamente. Le origini dati pubblicate consentono la centralizzazione e la scalabilità delle origini dati curate. Per maggiori informazioni, consulta Best practice per le origini dati pubblicate.
Combinare i dati
Se i dati provengono da una sola tabella, puoi connetterti ai dati per creare l’origine dati, trascinare la tabella nel canvas e quindi iniziare a creare la vista. Tuttavia, se i dati sono distribuiti tra più tabelle (o tra più database), sarà necessario combinarli. La combinazione dei dati avviene nella pagina Origine dati.
Singolo database | Più database |
|
|
Nota: per correlare tabelle tra diversi database, devi aggiungerle come connessioni dati all’interno della stessa origine dati, non come una nuova origine dati. Le connessioni dati vengono aggiunte tramite il collegamento Aggiungi nel riquadro sinistro. È possibile creare nuove origini dati dal menu Dati o dal menu a discesa dall’icona accanto al nome dell’origine dati, come illustrato nell’immagine seguente.
Metodi di combinazione dei dati
Le relazioni sono il modo predefinito per combinare i dati in Tableau. Le relazioni sono un modo flessibile e dinamico per combinare i dati di più tabelle per l’analisi. Se necessario, le tabelle possono anche essere sottoposte a join o unificate. Le origini dati possono anche essere combinate. Esaminiamo le opzioni per la combinazione dei dati in Tableau e alcune delle situazioni in cui ciascun metodo risulta utile.
Relazioni | Stabiliscono il potenziale per i join tra due tabelle in base ai campi correlati. Non uniscono i dati per creare una nuova tabella fissa. Durante l’analisi, eseguono automaticamente query sulle tabelle pertinenti utilizzando i join appropriati in base al contesto per generare una tabella di dati personalizzata per l’analisi. Mantengono il livello di dettaglio appropriato, non comportano perdite di dati, mantengono le aggregazioni appropriate e gestiscono i valori Null. |
Join | Uniscono due tabelle di dati in base a una clausola di join e a un tipo di join per formare una nuova tabella di dati fissa. Spesso utilizzati per aggiungere nuove colonne di dati nella stessa struttura di righe di base. Possono causare una perdita di dati con alcuni tipi di join se i campi non sono presenti in tutte le tabelle. Possono causare la duplicazione dei dati se le tabelle hanno diversi livelli di dettaglio. |
Unificazioni | Uniscono due o più tabelle di dati per formare una nuova tabella di dati fissa. Utilizzate per aggiungere (nuove righe di) dati nella stessa struttura di colonne di base. |
Combinazioni | Operano su due o più origini dati di Tableau distinte. I dati rimangono separati. Tableau esegue query sulle origini dati in modo indipendente e visualizza i risultati insieme nella vista, in base ai campi di collegamento stabiliti per il foglio. Simulano il comportamento di un join a sinistra e possono filtrare i dati provenienti da origini dati secondarie. |
Nota: è anche possibile combinare i dati con codice SQL personalizzato. Nella maggior parte dei casi, è consigliabile combinare i dati direttamente nel canvas o con la combinazione dei dati. Ciò assicura a Tableau la massima flessibilità per l’ottimizzazione. Tuttavia, in alcuni scenari, potrebbero esistere motivi per utilizzare codice SQL personalizzato. Tieni presente che questa operazione può avere implicazioni sulle prestazioni, perché Tableau è forzato a eseguire l’istruzione SQL personalizzata così com’è scritta.
Relazioni
Le relazioni sono un metodo per lavorare con i dati di più tabelle in base ai campi condivisi, ovvero alle colonne, tra tali tabelle. La definizione di una relazione indica a Tableau come possono essere connesse le righe tra le tabelle. Tableau memorizza queste informazioni, ma non riunisce immediatamente le righe come avviene con un join hard-coded. Al contrario, quando viene creata una visualizzazione, i campi coinvolti nell’analisi vengono ricondotti alla relazione e i join appropriati vengono creati per restituire i dati corretti.
Poiché i dati non vengono mai riuniti forzatamente in una singola tabella al di fuori del contesto di una visualizzazione, le relazioni sono utili quando i dati hanno diversi livelli di dettaglio o di granularità. Ad esempio, se è necessario lavorare con i dati sulle precipitazioni giornaliere in una tabella ma le temperature orarie in un’altra.
Per maggiori informazioni su come combinare le tabelle utilizzando le relazioni, consulta Correlare i dati
Per ulteriori informazioni su come combinare le tabelle utilizzando le relazioni, consulta Correlare i dati e questi post di blog di Tableau:
- Relationships, part 1: Introducing new data modeling in Tableau(Il collegamento viene aperto in una nuova finestra)
- Relationships, part 2: Tips and tricks(Il collegamento viene aperto in una nuova finestra)
- Relationships, part 3: Asking questions across multiple related tables(Il collegamento viene aperto in una nuova finestra)
Nota: in Tableau versione 2024.2 e successive, il modello di dati di Tableau supporta l’analisi multi-fatti e le dimensioni condivise tramite relazioni multi-fatti. Per maggiori informazioni, consulta Informazioni sui modelli di dati con relazioni multi-fatti(Il collegamento viene aperto in una nuova finestra), Quando utilizzare un modello con relazioni multi-fatti(Il collegamento viene aperto in una nuova finestra) e Creare un modello di dati con relazioni multi-fatti(Il collegamento viene aperto in una nuova finestra).
Join
La creazione di join è un metodo per combinare tabelle correlate in base a campi comuni. Il risultato della combinazione dei dati tramite un join è una tabella che viene estesa orizzontalmente aggiungendo colonne di dati.
Per maggiori informazioni su come eseguire join dei dati in Tableau, consulta Creare un join dei dati.
Combinazione di dati
Quando utilizzi l’unione dei dati per combinare i dati, combini i dati in ciò che è chiamata origine dati primaria con campi comuni provenienti da una o più origini dati secondarie.
La combinazione dei dati è utile quando è necessario modificare la modalità di configurazione dell’origine dati a livello di singolo foglio o quando si desidera combinare database che non consentono relazioni o join, ad esempio origini dati cubo o origini dati pubblicate.
Il risultato della combinazione dei dati è una tabella virtuale che viene estesa orizzontalmente aggiungendo colonne di dati. I dati di ogni origine dati verranno aggregati a un livello comune prima di essere mostrati insieme nella visualizzazione.
Per maggiori informazioni sul funzionamento della combinazione dei dati e su come combinare i dati in Tableau, consulta Combinare i dati.
Unificazione
L’unificazione è un metodo per l’aggiunta di valori (righe) a tabelle. Puoi unificare le tabelle se dispongono delle stesse colonne. Il risultato della combinazione di dati utilizzando un’unificazione è una tabella virtuale che ha le stesse colonne ma viene estesa verticalmente aggiungendo righe di dati.
Puoi unificare le tabelle in due modi: manualmente o utilizzando la ricerca con caratteri jolly. Per maggiori informazioni su come unificare i dati utilizzando uno di questi metodi in Tableau, consulta Unificare i dati.
Considerazioni relative a un’origine dati di Tableau
Innanzitutto, assicurati di avere chiaro lo scopo dell’origine dati. Se stai creando un’origine dati generale per un’ampia gamma di utenti con domande generiche, devi adottare un approccio diverso rispetto alla creazione di un’origine dati specializzata e ottimizzata per le prestazioni. È importante conoscere il tuo obiettivo fin dall’inizio.
Tenendo presente questo obiettivo, ci sono diversi elementi da considerare e pianificare prima di creare un’origine dati in Tableau:
- Posizione e accesso
- Struttura e pulizia
- Modello di dati e combinazione dei dati
- Metadati e personalizzazione
- Scalabilità, sicurezza e individuabilità
- Prestazioni e aggiornamento
Posizione e accesso
La posizione dei dati può essere semplice come un singolo file di Excel sul tuo computer o un foglio Google che hai creato o complessa come più database che utilizzano varie tecnologie. L’accesso può anche coinvolgere driver o connettori specifici per un database o informazioni di accesso per un server di database.
Domande da considerare:
- Gli utenti di Tableau corretti dispongono dell’accesso e delle autorizzazioni per i dati e per Tableau?
- Quale account utente deve essere utilizzato per accedere al database?
- Saranno necessari filtri degli utenti o la sicurezza a livello di riga?
- I dati di origine sono in locale o nel cloud?
- Questo può avere implicazioni se i dati vengono pubblicati in Tableau Cloud.
- Sono disponibili Connettori supportati?
- Esistono limitazioni per il database (supporta tutte le funzionalità che desideri utilizzare)?
Struttura e pulizia
L’organizzazione potrebbe disporre già di dati ben strutturati a cui è possibile connettersi o di processi ETL che è possibile utilizzare oppure potrebbe essere necessario utilizzare Tableau Prep Builder per eseguire operazioni di pulizia e modellazione al fine di ottenere dati in un formato utile.
Domande da considerare:
- I dati sono ben strutturati per l’utilizzo con Tableau?
- Devono essere utilizzati Tableau Prep Builder e Tableau Prep Conductor per pulire e automatizzare i flussi di preparazione dei dati?
- Quali calcoli o manipolazioni sarebbe preferibile eseguire in modo nativo in Tableau?
- Alcuni dati sono superflui? Alcuni dati mancano?
Modello di dati e combinazione dei dati
Tableau deve sapere come eseguire query sui dati. Tali informazioni sono specificate dal Modello di dati di Tableau. Se i dati provengono da più tabelle, devono essere combinati. I metodi per la combinazione dei dati includono relazioni, join, unificazoni e combinazioni.
Domande da considerare:
- I dati sono distribuiti tra più sistemi?
- Qual è il modo migliore per combinare ogni tabella di dati?
Metadati e personalizzazione
I dati vengono spesso memorizzati in un modo che non è facile da usare per una persona. Ad esempio, i nomi predefiniti dei campi possono essere poco intuitivi, può essere necessario aggiungere una formattazione personalizzata, le definizioni di abbreviazioni o codici potrebbero essere mancanti o calcoli comuni potrebbero non essere presenti nei dati sottostanti. La creazione di un livello semantico con tali informazioni può rendere i dati molto più facili da comprendere e usare.
Domande da considerare:
- Quali calcoli devono essere aggiunti?
- I nomi delle tabelle e dei campi sono comprensibili?
- Le impostazioni predefinite per i campi sono utili o devono essere personalizzate?
- Ci sono modifiche che dovrebbero essere apportate per supportare Tableau Catalog?
Tieni presente che Interpreta i dati al momento non supporta le origini dati multi-tabella.
Scalabilità, sicurezza e individuabilità
Un’origine dati può rimanere nella cartella di lavoro in cui è stata creata (origine dati incorporata) oppure può essere pubblicata in Tableau Server o Tableau Cloud indipendentemente da qualsiasi analisi come una risorsa di contenuto autonoma. Questa centralizzazione delle origini dati pubblicate presenta gli ulteriori vantaggi della sicurezza e della scalabilità, consentendo a più utenti di accedere a un’origine dati coerente. Le origini dati pubblicate possono inoltre sfruttare Tableau Catalog e i suggerimenti e fornire un’unica fonte di informazioni per un’organizzazione.
Domande da considerare:
- L’origine dati deve rimanere incorporata nella cartella di lavoro?
(Le domande seguenti presuppongono che l’origine dati sia pubblicata)
- Dove verrà pubblicata l’origine dati?
- Chi sarà il proprietario dell’origine dati?
- Quali autenticazioni e autorizzazioni deve avere?
- Sarà certificata?
Prestazioni e aggiornamento
Inoltre, le origini dati di Tableau possono essere connessioni live ai dati di origine o i dati possono essere copiati come un’estrazione aggiornabile. Le estrazioni possono migliorare le prestazioni dell’analisi o impedire un utilizzo eccessivo delle risorse dei sistemi di database.
Domande da considerare:
- La connessione dati deve essere live o un’estrazione?
- Se è un’estrazione, è prevista una pianificazione di aggiornamento? (Tableau Server | Tableau Cloud)
- Se è pubblicata in Tableau Cloud, sarà necessario utilizzare Tableau Bridge?
Creare origini dati di qualità
È necessario molto lavoro per realizzare un’origine dati ben progettata e con buone prestazioni. Tuttavia, non devi pubblicare il tuo primo tentativo. Come la creazione di una buona visualizzazione, la creazione di un’origine dati può essere un processo continuo. Prova a combinare i dati di cui pensi di avere bisogno e quindi cerca di stabilire se puoi creare la vista desiderata. Puoi sempre tornare indietro e scrivere un nuovo calcolo o introdurre un’altra tabella di dati. Esegui alcuni test con gli utenti e chiedi a un collega se riesce a capire i nomi dei campi.
Naturalmente, è consigliabile pubblicare solo le origini dati di cui sei sicuro e certificare solo quelle che hanno superato i controlli di qualità. Quando rendi l’origine dati accessibile agli utenti, questi dovrebbero essere in grado di considerarla attendibile.