Modello di dati di Tableau

Ogni origine dati creata in Tableau dispone di un modello di dati. Puoi considerare un modello di dati come un diagramma che indica a Tableau come eseguire query sui dati nelle tabelle di database connesse.

Le tabelle che aggiungi al canvas nella pagina Origine dati creano la struttura del modello di dati. Un modello di dati può essere semplice, ad esempio una singola tabella, oppure può essere più complesso, con più tabelle che utilizzano diverse combinazioni di relazioni, join e unioni.

Il modello di dati ha due livelli:

  • La vista predefinita che viene mostrata per prima nella pagina Origine dati è il livello logico dell’origine dati. I dati nel livello logico vengono combinati tramite le relazioni (o noodle). Puoi considerare questo livello come il canvas delle relazioni nella pagina Origine dati. Per maggiori informazioni, consulta Utilizzare le relazioni per l’analisi dei dati multi-tabella(Il collegamento viene aperto in una nuova finestra).
  • Il livello successivo è il livello fisico. I dati tra le tabelle del livello fisico vengono combinati tramite i join(Il collegamento viene aperto in una nuova finestra) e le unificazioni. Ogni tabella logica contiene almeno una tabella fisica in questo livello. Puoi considerare questo livello fisico come il canvas di join/unione nella pagina Origine dati. Fai doppio clic su una tabella logica per visualizzare o aggiungere join e unioni.

Livello logico Livello fisico
Noodle = Relazioni Diagramma di Venn = Join
 
Vista di primo livello di un’origine dati con più tabelle correlate. Questo è il livello logico. Le tabelle logiche possono essere combinate utilizzando le relazioni (noodle). Non usano i tipi di join. Si comportano come contenitori per le tabelle fisiche. Fai doppio clic su una tabella logica per aprirla e visualizzare le relative tabelle fisiche. Le tabelle fisiche possono essere combinate utilizzando i join o le unioni. In questo esempio, la tabella logica Libro è composta da tre tabelle fisiche unite (Libro, Premio, Informazioni).

 

Livello logico Livello fisico
Canvas delle relazioni nella pagina Origine dati Canvas di join/unione nella pagina Origine dati
Le tabelle trascinate qui sono denominate tabelle logiche Le tabelle trascinate qui sono denominate tabelle fisiche
Le tabelle logiche possono essere correlate ad altre tabelle logiche Le tabelle fisiche possono essere collegate tramite join o unite ad altre tabelle fisiche
Le tabelle logiche sono come contenitori per le tabelle fisiche Fai doppio clic su una tabella logica per visualizzare le relative tabelle fisiche
Il livello di dettaglio è a livello di riga della tabella logica Il livello di dettaglio è a livello di riga delle tabelle fisiche unite
Le tabelle logiche rimangono distinte (normalizzate), non unite nell’origine dati Le tabelle fisiche vengono unite in un’unica tabella flat, che definisce la tabella logica

Livelli del modello di dati

La vista principale di un’origine dati che viene mostrata è il livello logico del modello di dati. Può anche essere considerato il canvas delle relazioni, perché in questo caso le tabelle vengono combinate tramite relazioni anziché join.

Quando combini i dati di più tabelle, ogni tabella che trascini sul canvas nel livello logico deve avere una relazione con un’altra tabella. Non è necessario specificare i tipi di join per le relazioni: durante l’analisi, Tableau seleziona automaticamente i tipi di join appropriati in base ai campi e al contesto di analisi nel foglio di lavoro.

Il livello fisico del modello di dati è quello in cui è possibile combinare i dati tramite join e unioni. Puoi utilizzare solo i pivot in questo canvas. Può essere considerato il canvas di join/unione. Nelle versioni precedenti di Tableau, il livello fisico era l’unico livello nel modello di dati. Ogni tabella logica può contenere una o più tabelle fisiche.

Importante: è comunque possibile creare origini dati a tabella singola in Tableau che utilizzano join e unioni. Il comportamento di analisi delle tabelle singole in Tableau non è cambiato. Le cartelle di lavoro di cui è stato eseguito l’upgrade funzioneranno come prima della versione 2020.2.

Comprensione del modello di dati

Nelle versioni di Tableau precedenti alla 2020.2 il modello di dati era solo un livello fisico. In Tableau 2020.2 e versioni successive, il modello di dati ha il livello logico (semantico) e un livello fisico. In questo modo sono disponibili più opzioni per combinare i dati utilizzando schemi in base all’analisi.

In Tableau 2020.2 e versioni successive, è stato aggiunto un livello logico nell’origine dati. Ogni tabella logica contiene tabelle fisiche in un livello fisico.

Nelle versioni Tableau precedenti alla 2020.2 il modello di dati nell’origine dati comprendeva un singolo livello fisico in cui era possibile specificare i join e le unificazioni. Le tabelle aggiunte al livello fisico (sottoposte a join o unite) creano un’unica tabella appiattita (denormalizzata) per l’analisi.

Versioni precedenti 2020.2 e versioni successive
 
Nelle versioni di Tableau precedenti alla 2020.2, il modello di dati comprende solo il livello fisico Nella versione 2020.2 e successive, il modello di dati comprende due livelli: il livello logico e il livello fisico

In Tableau 2020.2 e versioni successive il modello di dati nell’origine dati include un nuovo livello semantico sopra il livello fisico (denominato livello logico), in cui è possibile aggiungere più tabelle e metterle in relazione tra loro. Le tabelle nel livello logico non vengono unite nell’origine dati: rimangono distinte (normalizzate) e mantengono il livello di dettaglio nativo.

Le tabelle logiche operano come contenitori per le tabelle fisiche unite. Una tabella logica può contenere una singola tabella fisica oppure può contenere più tabelle fisiche unite tramite join o unioni.

Creare un nuovo modello

Quando aggiungi una o più tabelle al livello logico, stai essenzialmente creando il modello di dati per l’origine dati. Un’origine dati può essere costituita da una singola tabella logica oppure è possibile trascinare più tabelle sul canvas per creare un modello più complesso.

  • La prima tabella trascinata sul canvas diventa la tabella radice per il modello di dati nell’origine dati.
  • Dopo aver trascinato la tabella radice, puoi trascinare altre tabelle in qualsiasi ordine. Dovrai considerare quali tabelle devono essere correlate tra loro e le coppie di campi corrispondenti da definire per ogni relazione.
  • Se stai creando uno schema a stella, può essere utile trascinare prima la tabella dei fatti e quindi correlare le tabelle delle dimensioni a tale tabella.
  • L’eliminazione di una tabella nel canvas comporta automaticamente anche l’eliminazione dei discendenti correlati. Se elimini la tabella radice, vengono rimosse anche tutte le altre tabelle nel modello.
  • Ogni relazione deve essere formata da almeno una coppia di campi corrispondenti. Aggiungi più coppie di campi per creare una relazione composta. Le coppie associate devono avere lo stesso tipo di dati. La modifica del tipo di dati nella pagina Origine dati non modifica questo requisito. Tableau continuerà a utilizzare il tipo di dati nel database sottostante per le query.
  • Le relazioni possono essere basate su campi calcolati.
  • Puoi specificare come confrontare i campi utilizzati nelle relazioni usando gli operatori quando definisci la relazione.

Per maggiori informazioni sulle relazioni, consulta Creare e definire relazioni in Correlare i dati.

Modello multi-tabella

  • Per creare un modello multi-tabella, trascina le tabelle nel livello logico del canvas della pagina Origine dati.


Le tabelle che trascini nel livello logico del canvas della pagina Origine dati devono essere correlate tra loro. Quando trascini altre tabelle nel canvas del livello logico, Tableau tenta automaticamente di creare la relazione in base ai vincoli di chiave esistenti e ai campi corrispondenti per definire la relazione. Se non è in grado di determinare i campi corrispondenti, sarà necessario selezionarli.

Se non viene rilevato alcun vincolo, viene creata una relazione Molti-a-molti e l’integrità referenziale viene impostata su Alcuni record corrispondono. Queste impostazioni predefinite rappresentano una scelta sicura e offrono la massima flessibilità per l’origine dati. Le impostazioni predefinite supportano i join esterni completi e ottimizzano le query aggregando i dati della tabella prima di formare i join durante l’analisi. Tutti i dati delle colonne e delle righe di ogni tabella diventano disponibili per l’analisi.

Puoi aggiungere altri dati all’interno di qualsiasi tabella logica facendo doppio clic sulla tabella. Verrà aperto il livello fisico del canvas della pagina Origine dati. Se devi utilizzare join o unioni, puoi trascinare le tabelle di cui desideri eseguire il join o l’unione nel canvas del livello fisico. Le tabelle fisiche vengono unite nella relativa tabella logica.

Segui i passaggi descritti in Creare e definire relazioni per combinare più tabelle.

Modello a tabella singola

  • Per creare un modello a tabella singola, trascina una tabella nel canvas del livello logico della pagina Origine dati. Puoi quindi utilizzare i campi di tale tabella nel riquadro Dati per l’analisi.

Modello a tabella singola che contiene altre tabelle

Puoi aggiungere altri dati all’interno della singola tabella logica facendo doppio clic sulla tabella. Verrà aperto il livello fisico del canvas della pagina Origine dati. Se devi utilizzare join o unioni, puoi trascinare le tabelle di cui desideri eseguire il join o l’unione nel canvas del livello fisico. Le tabelle fisiche vengono unite nella relativa tabella logica.

Questo esempio mostra la tabella Libro nel canvas delle relazioni (livello logico) dell’origine dati. Facendo doppio clic sulla tabella logica Libro, verrà aperto il canvas di join/unione (livello fisico).

In questo esempio, i join uniscono le tabelle Premio e Informazioni con la tabella Libro. In questo caso, il join tra Libro e Premio sarà uno-a-molti, al livello di dettaglio dei premi. Ciò duplicherebbe i valori delle misure per Libro e Informazioni. Per evitare la duplicazione, puoi correlare Premio e Informazioni a Libro invece di unirli tramite join all’interno della tabella logica Libro.

Schemi del modello di dati supportati

Le funzionalità di modellazione dei dati introdotte in Tableau a partire dalla versione 2020.2 sono progettate per semplificare l’analisi in comuni scenari di dati multi-tabella, inclusi i modelli di dati a stella e a fiocco di neve. I seguenti tipi di modelli sono supportati nelle origini dati Tableau.

Tabella singola

L’analisi di una singola tabella logica che contiene una combinazione di dimensioni e misure funziona come in Tableau prima della versione 2020.2. Puoi creare una tabella logica utilizzando una combinazione di join, unioni, SQL personalizzato e così via.

Stella e fiocco di neve

Nei data warehouse aziendali, è comune disporre di dati strutturati in schemi a stella o a fiocco di neve, in cui le misure sono contenute in una tabella dei fatti centrale e le dimensioni vengono archiviate separatamente in tabelle delle dimensioni indipendenti. Questa organizzazione dei dati supporta molti flussi di analisi comuni, tra cui il rollup e il drill-down.

Questi modelli possono essere rappresentati direttamente con le relazioni nelle funzionalità di modellazione dei dati disponibili a partire da Tableau 2020.2.

Trascina prima la tabella dei fatti nel modello e quindi correla le tabelle delle dimensioni alla tabella dei fatti (in uno schema a stella) o ad altre tabelle delle dimensioni (in uno schema a fiocco di neve).

In genere, in uno schema a stella o a fiocco di neve ben modellato, le relazioni tra la tabella dei fatti e le tabelle delle dimensioni saranno molti-a-uno. Se queste informazioni sono codificate nel data warehouse, Tableau le utilizzerà automaticamente per impostare le opzioni per le prestazioni della relazione. In caso contrario, puoi impostare queste informazioni manualmente. Per maggiori informazioni, consulta Ottimizzare le query di relazione utilizzando le opzioni per le prestazioni.

In uno schema a stella o a fiocco di neve ben modellato, ogni riga nella tabella dei fatti avrà una voce corrispondente in ognuna delle tabelle delle dimensioni. Se questo è vero e i vincoli di integrità del data warehouse lo riflettono, Tableau utilizzerà automaticamente queste informazioni per configurare l’impostazione di integrità referenziale nelle opzioni per le prestazioni. Se alcune righe della tabella dei fatti non dispongono di una riga corrispondente in una tabella delle dimensioni (una situazione talvolta denominata "dimensioni arrivate in ritardo" o "fatti arrivati in anticipo"), per impostazione predefinita Tableau manterrà tutte le righe durante il calcolo delle misure, ma potrebbe eliminare i valori quando vengono visualizzate le intestazioni delle dimensioni. Per maggiori informazioni, consulta Ottimizzare le query di relazione utilizzando le opzioni per le prestazioni.

Stella e fiocco di neve con misure in più di una tabella

In alcuni schemi a stella o a fiocco di neve, tutte le misure per l’analisi sono contenute nella tabella dei fatti. Spesso, tuttavia, ulteriori misure di interesse possono essere correlate alle tabelle delle dimensioni nell’analisi. Anche se le tabelle delle dimensioni non contengono misure, di frequente nelle analisi si desidera conteggiare o aggregare in altro modo i valori delle dimensioni. In questi casi, la distinzione tra tabelle dei fatti e tabelle delle dimensioni è meno chiara. Per aumentare la chiarezza durante la visualizzazione del modello di dati, è consigliabile aggiungere prima la tabella con la maggiore granularità al canvas dell’origine dati e quindi correlare tutte le altre tabelle alla prima tabella.

Se si eseguisse il join di queste tabelle in un’unica tabella logica, le misure nelle tabelle delle dimensioni verrebbero replicate, con conseguenti distorsioni nelle aggregazioni, a meno che non si provveda a deduplicare i valori utilizzando calcoli LOD o COUNT DISTINCT. Se invece si creano relazioni tra queste tabelle, Tableau aggregherà le misure prima di eseguire i join, evitando il problema delle duplicazioni non necessarie. Questo evita di dover monitorare con attenzione il livello di dettaglio delle misure.

Analisi multi-fatti

Nella versione 2024.2 e successive le funzionalità di modellazione dei dati di Tableau supportano l’analisi multi-fatti attraverso l’uso di relazioni multi-fatti. Per informazioni approfondite su come creare modelli di dati di relazioni multi-fatti, vedere:

Un modello con relazioni multi-fatti, ovvero un modello di dati con più tabelle di base, consente di utilizzare tabelle non correlate nel modello se nel modello esistono anche tabelle condivise. Durante l’analisi, i campi di una tabella condivisa congiungono tabelle di dati altrimenti non correlate in base alle dimensioni condivise che hanno in comune, ad esempio il fatto che si verifichino nello stesso luogo o nello stesso momento. Tutti i vantaggi delle relazioni vengono mantenuti, inclusa la conservazione della granularità di ogni tabella o del livello di dettaglio nativo.

Analogamente a un modello di dati con tabella di base singola, Tableau determina il miglior tipo di join da utilizzare dietro le quinte in base alla struttura della visualizzazione. Ma in un modello con relazioni multi-fatti, le opzioni di join vengono ampliate e includono join esterni e cross join per gestire diversi livelli di correlazione. Per maggiori informazioni, consulta Informazioni sui modelli di dati con relazioni multi-fatti(Il collegamento viene aperto in una nuova finestra).

Nota: nelle versioni dalla 2020.2 alla 2024.1 è possibile aggiungere tabelle dei fatti (contenenti misure) ai modelli a stella e a fiocco di neve solo se sono correlati a una singola tabella delle dimensioni.

Ad esempio, puoi riunire due o più tabelle dei fatti per analizzare una dimensione condivisa, come nel caso delle analisi di tipo Customer 360. Queste tabelle dei fatti possono avere un livello di dettaglio diverso rispetto alla tabella delle dimensioni o l’una dall’altra. Possono inoltre avere una relazione molti-a-molti con la tabella delle dimensioni. In questi scenari, Tableau garantirà che i valori non vengano replicati prima dell’aggregazione.

Se non hai una tabella delle dimensioni condivisa che mette in relazione le tabelle dei fatti, talvolta puoi crearne una in modo dinamico utilizzando codice SQL personalizzato oppure join o unioni di altre tabelle delle dimensioni.

Due tabelle dei fatti possono essere correlate direttamente tra loro in base a una dimensione comune. Questo tipo di analisi funziona al meglio quando una delle tabelle dei fatti contiene un soprainsieme della dimensione comune.

Esistono vari scenari che potrebbero indicare la necessità di creare un modello con relazioni multi-fatti con più tabelle di base anziché un’origine dati a tabella di base singola:

  • Relazioni circolari. Le relazioni circolari non sono supportate. Se stai provando a creare un’origine dati con un ciclo, utilizza relazioni multi-fatti e imposta invece la tabella a valle come un’altra tabella di base.
  • Dimensioni conformi e relazioni OR contestuali. Se disponi di una serie di tabelle correlate agli stessi insiemi di clausole di relazione (come data e posizione), tali dimensioni devono essere estratte e trasformate in tabelle condivise.
    • Ciò è particolarmente utile perché più clausole di relazione devono essere tutte vere (AND dal punto di vista logico) affinché le tabelle siano correlate per tali record.
    • Se, invece, desideri analizzare record in cui le clausole possono essere vere una alla volta (OR contestuale), questa flessibilità viene offerta impostando un modello di dati con tabelle delle dimensioni condivise.
  • Combinazioni equivalenti. Se utilizzi una combinazione ma desideri avere una combinazione equivalente senza origini dati primarie e secondarie, crea un modello di dati che combini le origini dati della combinazione con i relativi campi di collegamento in una o più tabelle condivise.

Requisiti per le relazioni in un modello di dati

  • Quando crei una correlazione tra tabelle, i campi che definiscono le relazioni devono avere lo stesso tipo di dati. La modifica del tipo di dati nella pagina Origine dati non modifica questo requisito. Tableau continuerà a utilizzare il tipo di dati nel database sottostante per le query.
  • Non puoi definire relazioni basate su campi geografici.
  • Le relazioni circolari non sono supportate nel modello di dati.
  • Non puoi definire relazioni tra origini dati pubblicate.

Fattori che limitano i vantaggi dell’utilizzo delle tabelle correlate

  • La presenza di dati sporchi nelle tabelle (ovvero, tabelle che non sono state create tenendo presente un modello ben strutturato e contengono una combinazione di misure e dimensioni in più tabelle) può rendere più complessa l’analisi multi-tabella.
  • L’utilizzo di filtri dell’origine dati limiterà la capacità di Tableau di eseguire la selezione per join nei dati. La selezione per join è un’espressione che fa riferimento al modo in cui Tableau semplifica le query rimuovendo i join non necessari.
  • Tabelle con molti valori non corrispondenti tra le relazioni.
  • Nelle versioni dalla 2020.2 alla 2024.1: interrelazione di più tabelle dei fatti con più tabelle delle dimensioni (tentativo di modellare dimensioni condivise o conformi). Nella versione 2024.2 e successive è possibile utilizzare relazioni multi-fatti per gestire questi casi.
Grazie per il tuo feedback.Il tuo feedback è stato inviato. Grazie!