Modello di dati di Tableau

Ogni origine dati creata in Tableau dispone di un modello di dati. Puoi considerare un modello di dati come un diagramma che indica a Tableau come eseguire query sui dati nelle tabelle di database connesse.

Le tabelle che aggiungi al canvas nella pagina Origine dati creano la struttura del modello di dati. Un modello di dati può essere semplice, ad esempio una singola tabella, oppure può essere più complesso, con più tabelle che utilizzano diverse combinazioni di relazioni, join e unioni.

Il modello di dati ha due livelli:

  • La vista predefinita che viene mostrata per prima nella pagina Origine dati è il livello logico dell’origine dati. I dati nel livello logico vengono combinati tramite le relazioni (o noodle). Puoi considerare questo livello come il canvas delle relazioni nella pagina Origine dati. Per maggiori informazioni, consulta Utilizzare le relazioni per l’analisi dei dati multi-tabella.
  • Il livello successivo è il livello fisico. I dati tra le tabelle del livello fisico vengono combinati tramite i join(Il collegamento viene aperto in una nuova finestra) e le unificazioni. Ogni tabella logica contiene almeno una tabella fisica in questo livello. Puoi considerare questo livello fisico come il canvas di join/unione nella pagina Origine dati. Fai doppio clic su una tabella logica per visualizzare o aggiungere join e unioni.

Livello logico Livello fisico
Noodle = Relazioni Diagramma di Venn = Join
 
Vista di primo livello di un’origine dati con più tabelle correlate. Questo è il livello logico. Le tabelle logiche possono essere combinate utilizzando le relazioni (noodle). Non usano i tipi di join. Si comportano come contenitori per le tabelle fisiche. Fai doppio clic su una tabella logica per aprirla e visualizzare le relative tabelle fisiche. Le tabelle fisiche possono essere combinate utilizzando i join o le unioni. In questo esempio, la tabella logica Libro è composta da tre tabelle fisiche unite (Libro, Premio, Informazioni).

 

Livello logico Livello fisico
Canvas delle relazioni nella pagina Origine dati Canvas di join/unione nella pagina Origine dati
Le tabelle trascinate qui sono denominate tabelle logiche Le tabelle trascinate qui sono denominate tabelle fisiche
Le tabelle logiche possono essere correlate ad altre tabelle logiche Le tabelle fisiche possono essere collegate tramite join o unite ad altre tabelle fisiche
Le tabelle logiche sono come contenitori per le tabelle fisiche Fai doppio clic su una tabella logica per visualizzare le relative tabelle fisiche
Il livello di dettaglio è a livello di riga della tabella logica Il livello di dettaglio è a livello di riga delle tabelle fisiche unite
Le tabelle logiche rimangono distinte (normalizzate), non unite nell’origine dati Le tabelle fisiche vengono unite in un’unica tabella flat, che definisce la tabella logica

Livelli del modello di dati

La vista principale di un’origine dati che viene mostrata è il livello logico del modello di dati. Può anche essere considerato il canvas delle relazioni, perché in questo caso le tabelle vengono combinate tramite relazioni anziché join.

Quando combini i dati di più tabelle, ogni tabella che trascini sul canvas nel livello logico deve avere una relazione con un’altra tabella. Non è necessario specificare i tipi di join per le relazioni: durante l’analisi, Tableau seleziona automaticamente i tipi di join appropriati in base ai campi e al contesto di analisi nel foglio di lavoro.

Il livello fisico del modello di dati è quello in cui è possibile combinare i dati tramite join e unioni. Puoi utilizzare solo i pivot in questo canvas. Può essere considerato il canvas di join/unione. Nelle versioni precedenti di Tableau, il livello fisico era l’unico livello nel modello di dati. Ogni tabella logica può contenere una o più tabelle fisiche.

Importante: è comunque possibile creare origini dati a tabella singola in Tableau che utilizzano join e unioni. Il comportamento di analisi delle tabelle singole in Tableau non è cambiato. Le cartelle di lavoro di cui è stato eseguito l’upgrade funzioneranno come prima della versione 2020.2.

Comprensione del modello di dati

Nelle versioni precedenti di Tableau, il modello di dati comprendeva solo il livello fisico. In Tableau 2020.2 e versioni successive, il modello di dati ha il livello logico (semantico) e un livello fisico. In questo modo sono disponibili più opzioni per combinare i dati utilizzando schemi in base all’analisi.

In Tableau 2020.2 e versioni successive, è stato aggiunto un livello logico nell’origine dati. Ogni tabella logica contiene tabelle fisiche in un livello fisico.

Nelle versioni precedenti di Tableau, il modello di dati nell’origine dati comprendeva un singolo livello fisico in cui era possibile specificare i join e le unificazioni. Le tabelle aggiunte al livello fisico (sottoposte a join o unite) creano un’unica tabella appiattita (denormalizzata) per l’analisi.

Versioni precedenti 2020.2 e versioni successive
 
Nelle versioni di Tableau precedenti alla 2020.2, il modello di dati comprende solo il livello fisico Nella versione 2020.2 e successive, il modello di dati comprende due livelli: il livello logico e il livello fisico

A partire da Tableau 2020.2, il modello di dati nell’origine dati include un nuovo livello semantico sopra il livello fisico (denominato livello logico), in cui è possibile aggiungere più tabelle e metterle in relazione tra loro. Le tabelle nel livello logico non vengono unite nell’origine dati: rimangono distinte (normalizzate) e mantengono il livello di dettaglio nativo.

Le tabelle logiche operano come contenitori per le tabelle fisiche unite. Una tabella logica può contenere una singola tabella fisica oppure può contenere più tabelle fisiche unite tramite join o unioni.

Creare un nuovo modello

Quando aggiungi una o più tabelle al livello logico, stai essenzialmente creando il modello di dati per l’origine dati. Un’origine dati può essere costituita da una singola tabella logica oppure è possibile trascinare più tabelle sul canvas per creare un modello più complesso.

  • La prima tabella trascinata sul canvas diventa la tabella radice per il modello di dati nell’origine dati.
  • Dopo aver trascinato la tabella radice, puoi trascinare altre tabelle in qualsiasi ordine. Dovrai considerare quali tabelle devono essere correlate tra loro e le coppie di campi corrispondenti da definire per ogni relazione.
  • Se stai creando uno schema a stella, può essere utile trascinare prima la tabella dei fatti e quindi correlare le tabelle delle dimensioni a tale tabella.
  • L’eliminazione di una tabella nel canvas comporta automaticamente anche l’eliminazione dei discendenti correlati. Se elimini la tabella radice, vengono rimosse anche tutte le altre tabelle nel modello.
  • Ogni relazione deve essere formata da almeno una coppia di campi corrispondenti. Aggiungi più coppie di campi per creare una relazione composta. Le coppie associate devono avere lo stesso tipo di dati. La modifica del tipo di dati nella pagina Origine dati non modifica questo requisito. Tableau continuerà a utilizzare il tipo di dati nel database sottostante per le query.
  • Le relazioni possono essere basate su campi calcolati.
  • Puoi specificare come confrontare i campi utilizzati nelle relazioni usando gli operatori quando definisci la relazione.

Per maggiori informazioni sulle relazioni, consulta Creare e definire relazioni in Correlare i dati.

Modello multi-tabella

  • Per creare un modello multi-tabella, trascina le tabelle nel livello logico del canvas della pagina Origine dati.


Le tabelle che trascini nel livello logico del canvas della pagina Origine dati devono essere correlate tra loro. Quando trascini altre tabelle nel canvas del livello logico, Tableau tenta automaticamente di creare la relazione in base ai vincoli di chiave esistenti e ai campi corrispondenti per definire la relazione. Se non è in grado di determinare i campi corrispondenti, sarà necessario selezionarli.

Se non viene rilevato alcun vincolo, viene creata una relazione Molti-a-molti e l’integrità referenziale viene impostata su Alcuni record corrispondono. Queste impostazioni predefinite rappresentano una scelta sicura e offrono la massima flessibilità per l’origine dati. Le impostazioni predefinite supportano i full outer join e ottimizzano le query aggregando i dati della tabella prima di formare i join durante l’analisi. Tutti i dati delle colonne e delle righe di ogni tabella diventano disponibili per l’analisi.

Puoi aggiungere altri dati all’interno di qualsiasi tabella logica facendo doppio clic sulla tabella. Verrà aperto il livello fisico del canvas della pagina Origine dati. Se devi utilizzare join o unioni, puoi trascinare le tabelle di cui desideri eseguire il join o l’unione nel canvas del livello fisico. Le tabelle fisiche vengono unite nella relativa tabella logica.

Segui i passaggi descritti in Creare e definire relazioni per combinare più tabelle.

Modello a tabella singola

  • Per creare un modello a tabella singola, trascina una tabella nel canvas del livello logico della pagina Origine dati. Puoi quindi utilizzare i campi di tale tabella nel riquadro Dati per l’analisi.

Modello a tabella singola che contiene altre tabelle

Puoi aggiungere altri dati all’interno della singola tabella logica facendo doppio clic sulla tabella. Verrà aperto il livello fisico del canvas della pagina Origine dati. Se devi utilizzare join o unioni, puoi trascinare le tabelle di cui desideri eseguire il join o l’unione nel canvas del livello fisico. Le tabelle fisiche vengono unite nella relativa tabella logica.

Questo esempio mostra la tabella Libro nel canvas delle relazioni (livello logico) dell’origine dati. Facendo doppio clic sulla tabella logica Libro, verrà aperto il canvas di join/unione (livello fisico).

In questo esempio, i join uniscono le tabelle Premio e Informazioni con la tabella Libro. In questo caso, il join tra Libro e Premio sarà uno-a-molti, al livello di dettaglio dei premi. Ciò duplicherebbe i valori delle misure per Libro e Informazioni. Per evitare la duplicazione, puoi correlare Premio e Informazioni a Libro invece di unirli tramite join all’interno della tabella logica Libro.

Schemi del modello di dati supportati

Le funzionalità di modellazione dei dati introdotte in Tableau nella versione 2020.2 sono progettate per semplificare l’analisi in comuni scenari di dati multi-tabella, inclusi i modelli di dati a stella e a fiocco di neve. I seguenti tipi di modelli sono supportati nelle origini dati Tableau.

Tabella singola

L’analisi di una singola tabella logica che contiene una combinazione di dimensioni e misure funziona come in Tableau prima della versione 2020.2. Puoi creare una tabella logica utilizzando una combinazione di join, unioni, SQL personalizzato e così via.

Stella e fiocco di neve

Nei data warehouse aziendali, è comune disporre di dati strutturati in schemi a stella o a fiocco di neve, in cui le misure sono contenute in una tabella dei fatti centrale e le dimensioni vengono archiviate separatamente in tabelle delle dimensioni indipendenti. Questa organizzazione dei dati supporta molti flussi di analisi comuni, tra cui il rollup e il drill-down.

Questi modelli possono essere rappresentati direttamente con le relazioni nelle funzionalità di modellazione dei dati disponibili a partire da Tableau 2020.2.

Trascina prima la tabella dei fatti nel modello e quindi correla le tabelle delle dimensioni alla tabella dei fatti (in uno schema a stella) o ad altre tabelle delle dimensioni (in uno schema a fiocco di neve).

In genere, in uno schema a stella o a fiocco di neve ben modellato, le relazioni tra la tabella dei fatti e le tabelle delle dimensioni saranno molti-a-uno. Se queste informazioni sono codificate nel data warehouse, Tableau le utilizzerà automaticamente per impostare le opzioni per le prestazioni della relazione. In caso contrario, puoi impostare queste informazioni manualmente. Per maggiori informazioni, consulta Ottimizzare le query di relazione utilizzando le opzioni per le prestazioni.

In uno schema a stella o a fiocco di neve ben modellato, ogni riga nella tabella dei fatti avrà una voce corrispondente in ognuna delle tabelle delle dimensioni. Se questo è vero e i vincoli di integrità del data warehouse lo riflettono, Tableau utilizzerà automaticamente queste informazioni per configurare l’impostazione di integrità referenziale nelle opzioni per le prestazioni. Se alcune righe della tabella dei fatti non dispongono di una riga corrispondente in una tabella delle dimensioni (una situazione talvolta denominata "dimensioni arrivate in ritardo" o "fatti arrivati in anticipo"), per impostazione predefinita Tableau manterrà tutte le righe durante il calcolo delle misure, ma potrebbe eliminare i valori quando vengono visualizzate le intestazioni delle dimensioni. Per maggiori informazioni, consulta Ottimizzare le query di relazione utilizzando le opzioni per le prestazioni.

Stella e fiocco di neve con misure in più di una tabella

In alcuni schemi a stella o a fiocco di neve, tutte le misure per l’analisi sono contenute nella tabella dei fatti. Spesso, tuttavia, ulteriori misure di interesse possono essere correlate alle tabelle delle dimensioni nell’analisi. Anche se le tabelle delle dimensioni non contengono misure, di frequente nelle analisi si desidera conteggiare o aggregare in altro modo i valori delle dimensioni. In questi casi, la distinzione tra tabelle dei fatti e tabelle delle dimensioni è meno chiara. Per aumentare la chiarezza durante la visualizzazione del modello di dati, è consigliabile aggiungere prima la tabella con la maggiore granularità al canvas dell’origine dati e quindi correlare tutte le altre tabelle alla prima tabella.

Se si eseguisse il join di queste tabelle in un’unica tabella logica, le misure nelle tabelle delle dimensioni verrebbero replicate, con conseguenti distorsioni nelle aggregazioni, a meno che non si provveda a deduplicare i valori utilizzando calcoli LOD o COUNT DISTINCT. Se invece si creano relazioni tra queste tabelle, Tableau aggregherà le misure prima di eseguire i join, evitando il problema delle duplicazioni non necessarie. Questo evita di dover monitorare con attenzione il livello di dettaglio delle misure.

Analisi multi-fatti

Le funzionalità di modellazione dei dati di Tableau supportano alcune forme di analisi multi-fatti. È possibile aggiungere ulteriori tabelle dei fatti (contenenti misure) a qualsiasi dei modelli citati in precedenza, purché siano correlate solo a una singola tabella delle dimensioni. Ad esempio, puoi riunire due o più tabelle dei fatti per analizzare una dimensione condivisa, come nel caso delle analisi di tipo Customer 360. Queste tabelle dei fatti possono avere un livello di dettaglio diverso rispetto alla tabella delle dimensioni o l’una dall’altra. Possono inoltre avere una relazione molti-a-molti con la tabella delle dimensioni. In questi scenari, Tableau garantirà che i valori non vengano replicati prima dell’aggregazione.

Se non hai una tabella delle dimensioni condivisa che mette in relazione le tabelle dei fatti, talvolta puoi crearne una in modo dinamico utilizzando codice SQL personalizzato oppure join o unioni di altre tabelle delle dimensioni.

Due tabelle dei fatti possono essere correlate direttamente tra loro in base a una dimensione comune. Questo tipo di analisi funziona al meglio quando una delle tabelle dei fatti contiene un soprainsieme della dimensione comune.

Modelli non supportati

  • Più tabelle dei fatti correlate a più tabelle delle dimensioni condivise. In alcuni scenari di utilizzo è comune disporre di più tabelle dei fatti correlate a più tabelle delle dimensioni condivise. Ad esempio, potresti avere due tabelle dei fatti, Vendite in negozio e Vendite Internet, correlate a due tabelle delle dimensioni comuni, Data e Cliente. In genere, tali scenari richiedono la creazione di una relazione circolare nel modello di dati. Le relazioni circolari non sono attualmente supportate.

    Puoi approssimare questo tipo di modello unendo alcune delle tabelle nel livello fisico. Ad esempio, potresti unificare Vendite in negozio e Vendite Internet in una singola tabella, che può quindi essere correlata a Data e Cliente. In alternativa, potresti eseguire un cross join di Data e Cliente per creare una singola tabella delle dimensioni, che può quindi essere correlata a Vendite in negozio e Vendite Internet.

  • Correlazione diretta di 3 o più tabelle dei fatti su dimensioni condivise. Sebbene sia possibile creare questo modello nel livello logico, potresti visualizzare risultati indesiderati, a meno che non utilizzi solo le dimensioni di una singola tabella.

Requisiti per le relazioni in un modello di dati

  • Quando crei una correlazione tra tabelle, i campi che definiscono le relazioni devono avere lo stesso tipo di dati. La modifica del tipo di dati nella pagina Origine dati non modifica questo requisito. Tableau continuerà a utilizzare il tipo di dati nel database sottostante per le query.
  • Non puoi definire relazioni basate su campi geografici.
  • Le relazioni circolari non sono supportate nel modello di dati.
  • Non puoi definire relazioni tra origini dati pubblicate.

Fattori che limitano i vantaggi dell’utilizzo delle tabelle correlate

  • La presenza di dati sporchi nelle tabelle (ovvero, tabelle che non sono state create tenendo presente un modello ben strutturato e contengono una combinazione di misure e dimensioni in più tabelle) può rendere più complessa l’analisi multi-tabella.
  • L’utilizzo di filtri dell’origine dati limiterà la capacità di Tableau di eseguire la selezione per join nei dati. La selezione per join è un’espressione che fa riferimento al modo in cui Tableau semplifica le query rimuovendo i join non necessari.
  • Tabelle con molti valori non corrispondenti tra le relazioni.
  • Interrelazione di più tabelle dei fatti con più tabelle delle dimensioni (tentativo di modellare dimensioni condivise o conformi).
Grazie per il tuo feedback.Il tuo feedback è stato inviato. Grazie!