Informazioni sui modelli di dati con relazioni multi-fatti

Le relazioni multi-fatti ti consentono di creare origini dati con più di una tabella di base. L’utilizzo di più tabelle di base nel modello di dati consente di eseguire l’analisi multi-fatti in Tableau.

Stabilendo alberi di tabelle, con radice in una tabella di base, è possibile modellare strutture di dati con domini concettuali diversi e utilizzare le loro caratteristiche condivise per collegarle. Questo tipo di analisi viene spesso definito analisi multi-fatti, dimensioni conformate o dimensioni condivise. In Tableau lo chiamiamo modello di dati con relazioni multi-fatti, perché vengono utilizzate le relazioni per crearlo. Un modello di dati con relazioni multi-fatti contiene sempre più tabelle di base. Le tabelle di base sono le tabelle più a sinistra nel modello di dati. Per indicazioni su come determinare quali tabelle utilizzare come tabelle di base, consulta Quando utilizzare un modello con relazioni multi-fatti.

un modello con più tabelle di base con un albero evidenziato

Un modello di dati con più tabelle di base con l’albero di una tabella di base evidenziato.

Livelli di correlazione

I modelli di dati con più tabelle di base offrono molta flessibilità rispetto al modo in cui i dati possono essere correlati (o meno) tra loro.

Nota: la correlazione a qualsiasi livello è rilevante solo nei modelli di dati con più tabelle di base. Prima dei modelli di dati con relazioni multi-fatti, venivano correlati tutti gli elementi (all'interno di una singola origine dati) o non veniva correlato alcun elemento (combinazione di più origini dati).

Correlazione nel modello di dati

Le tabelle sono correlate, non correlate o condivise in base alla struttura del modello di dati. In un’origine dati, la correlazione delle tabelle è una costante. Come breve panoramica: 

  • Le tabelle correlate sono sullo stesso albero.
    • Prima della versione 2024.2, tutte le origini dati erano origini dati con singole tabelle di base costituite da un singolo albero e in un’origine dati con singole tabelle di base tutte le tabelle sono correlate.
  • Le tabelle non correlate sono su alberi diversi. Le tabelle di base sono sempre non correlate tra loro. Anche le tabelle che si trovano esattamente a valle di una tabella di base non sono correlate alle tabelle di altri alberi.
  • Le tabelle condivise hanno più relazioni in entrata e appartengono a più di un albero.
    • Anche le tabelle a valle di una tabella con più relazioni in entrata sono considerate condivise.

Correlazione durante l’analisi

I campi possono essere correlati, non correlati, non ancora correlati, correlati in modo ambiguo oppure possono operare come campi di congiunzione. La correlazione tra un gruppo di campi viene determinata a livello di singolo foglio in base alla struttura del modello di dati, a quali campi sono attivamente in uso (ovvero negli spazi come pillole) e al fatto che tali campi siano dimensioni o misure.

una semplice visualizzazione con due campi non correlati, uno per le righe e uno per le colonne, e un riquadro delle informazioni non correlate visualizzato

Per creare una visualizzazione con campi di più tabelle, Tableau deve eseguire join in background per calcolare i valori. Il tipo di join utilizzato dipende dalla correlazione dei campi. Come breve panoramica: 

  • Quando in una visualizzazione vengono utilizzati campi correlati, le dimensioni vengono sottoposte a join interno e i valori delle misure sono ripartiti in base alle dimensioni.
    • È un po’ più complicato di così: potrebbero essere necessari ulteriori join in background per garantire che nessun valore delle misure venga eliminato. Tuttavia, in una visualizzazione con sole dimensioni, le dimensioni correlate sono sottoposte a join interni: questo è il concetto principale a tale proposito.
    • Questo è lo stesso comportamento dei modelli con singole tabelle di base.
  • Quando in una visualizzazione vengono utilizzati campi non correlati, le dimensioni vengono sottoposte a cross join. I valori delle misure sono elaborati con ambito tabella (ovvero vengono aggregati in locale a un singolo valore per l’intera tabella) e ripetuti.
    • È anche possibile che i campi siano correlati in modo ambiguo o non ancora correlati, il che significa che per la combinazione di campi attivi esiste più di un modo per risolvere le relazioni tra le relative tabelle. Se Tableau rileva incertezza, considera i campi come non correlati.
  • Quando i campi sono congiunti in base a un campo condiviso, le dimensioni vengono sottoposte a join esterno. I valori delle misure vengono aggregati a livello di qualsiasi dimensione in base alla quale possono essere ripartiti e potrebbero essere ripetuti.
    • Le dimensioni di congiunzione sono simili ai campi di collegamento nella combinazione dei dati. I risultati vengono calcolati per ciascuna coppia di campi correlati, quindi i valori non correlati vengono congiunti attraverso i valori condivisi della dimensione condivisa tra loro.

Tutti questi concetti e definizioni sono illustrati in modo più dettagliato più avanti in questo argomento.

Una digressione su dimensioni e misure

In Tableau, le misure sono aggregazioni: vengono aggregate fino alla granularità impostata dalle dimensioni nella vista. Il valore di una misura dipende quindi dal contesto delle dimensioni. Ad esempio, il “numero di confezioni di cereali” varia a seconda dal fatto che intendiamo l’inventario totale o il numero di confezioni per ogni marchio.

Le dimensioni in genere sono campi categorici, come il paese o il marchio. In Tableau, le dimensioni impostano la granularità, o il livello di dettaglio, della vista. In genere desideriamo raggruppare i dati in indicatori in base a una combinazione di categorie. Le dimensioni che utilizziamo per creare la vista determinano quanti indicatori sono disponibili.

Quando una misura viene utilizzata senza dimensioni, viene elaborata con ambito tabella. Ciò significa che il suo valore è il valore completamente aggregato per l’intera tabella. Non appena utilizziamo una dimensione come il marchio nella visualizzazione, la misura viene ripartita in modo più granulare. Il numero totale di confezioni di cereali ora è ripartito per marchio.

L’aggregazione si riferisce alla modalità di combinazione dei dati. L’aggregazione predefinita di Tableau è SUM. È possibile modificare l’aggregazione in altre opzioni, come la media, la mediana, il conteggio dei valori univoci, il minimo e così via. La granularità si riferisce a quanto è dettagliata o ripartita la misura: un elemento che è controllato dalle dimensioni. A meno che la granularità della misura non sia a livello di riga (ovvero disaggregata), il relativo valore deve essere aggregato.

Esempio

una tabella di valori per il numero di confezioni di cereali, per cinque marchi e tre dimensioni delle confezioni

Qual è il valore di “numero di confezioni di cereali”?

Dipende dal tipo di aggregazione e dalla granularità impostate dalle dimensioni.

  • Aggregazioni:
    • Somma (o totale)
    • Media
  • Granularità:
    • Con ambito tabella/completamente aggregato (le barre blu nell’esempio)
    • Ripartizione in base alla dimensione Marchio (le barre colorate nell’esempio)

Una dashboard con quattro visualizzazioni, una per la somma del numero di confezioni con ambito tabella (54), una con il numero medio di confezioni con ambito tabella (6), quindi le versioni di queste due visualizzazioni ripartite per i cinque marchi

Indicatori di correlazione a livello di campo

Esistono diversi indicatori visivi che possono aiutarti a comprendere il grado di correlazione tra i campi che stai utilizzando in un’analisi.

Indicatori di correlazione in un foglio di lavoro

  • Icona di non correlazione: in Tableau viene utilizzata un’icona di non correlazione icona di non correlazione per indicare che non tutti gli elementi nella vista sono correlati. Se visualizzi un’icona di non correlazione su una pillola nella vista o nel riquadro Dati, puoi passare il puntatore del mouse sull’icona per ottenere maggiori informazioni.
    • L'icona correlata indica che il campo congiunge campi non correlati.
  • Nomi dei campi in grigio chiaro: i nomi dei campi vengono visualizzati in testo grigio chiaro nel riquadro Dati quando non sono correlati ad alcuno dei campi in uso negli spazi. Puoi comunque utilizzare questi campi per l’analisi nella visualizzazione, ma nell’analisi i campi non correlati sono valutati diversamente rispetto ai campi correlati. Al passaggio del puntatore del mouse, anche questi campi mostrano un’icona di non correlazione.

il riquadro Dati, con un’intera tabella in grigio e due campi con l’icona a forma di occhio con una barra per i campi nascosti

Nota: nelle versioni precedenti di Tableau, i nomi dei campi in grigio chiaro indicavano che i campi erano nascosti e che l’opzione Mostra campi nascosti era selezionata. I campi nascosti, quando vengono visualizzati, ora sono indicati da un’icona a forma di occhio su cui è possibile fare clic icona di un campo nascosto.

Finestra di dialogo di avviso per la correlazione

Quando campi non correlati vengono utilizzati insieme in una visualizzazione, Tableau mostra una finestra di dialogo di avviso per segnalare che i campi non sono correlati. Questo avviso viene visualizzato ogni volta che si aggiunge un campo non correlato per evitare cross join accidentali che potrebbero influire sulle prestazioni.

  • Se si desidera utilizzare campi non correlati senza congiunzione, fai clic su Aggiungi per continuare ad aggiungere il campo alla visualizzazione.
  • Se si desidera congiungere campi non correlati, la procedura consigliata è quella di far emergere il campo da congiungere prima di un campo altrimenti non correlato. La finestra di dialogo non verrà visualizzata se il campo di congiunzione è già in uso. Consulta Come vengono utilizzati i join per ogni livello di correlazione per maggiori informazioni su come la congiunzione impedisce i cross join.

finestra di dialogo di avviso per la correlazione che mostra un avviso per le dimensioni non correlate

Quando si aggiungono più campi o sono già presenti nella vista, nella finestra di dialogo viene visualizzata l’area Dettagli. Espandila per visualizzare ulteriori informazioni sulla correlazione di tutti i campi in uso e identificare l’origine del problema di mancata correlazione.

finestra di dialogo di avviso per la correlazione con un messaggio sia per le dimensioni che per le misure non correlate e con l’area Dettagli espansa

Per impedire che il messaggio di avviso venga visualizzato, seleziona l'opzione Non mostrare più questo messaggio. Puoi sempre riattivare questi messaggi di avviso riattivandoli:

  • In Tableau Desktop, apri il menu Guida online > Impostazioni e prestazioni > Reimposta i messaggi ignorati.
  • In un browser, cancella i dati memorizzati nella cache. Ad esempio in Chrome, apri il Menù a 3 puntiElimina dati di navigazione... > Scegli "Immagini e file memorizzati nella cache" > Elimina i dati.

Correlazione a livello di tabella nel modello di dati

In un modello di dati con più tabelle di base, ciascuna tabella di base definisce un insieme di tabelle correlate, che formano un albero concettuale. Questi alberi devono essere collegati da almeno una tabella condivisa per garantire che l’origine dati complessiva sia una singola entità.

Quelle che in precedenza avrebbero potuto essere due origini dati unite tramite campi di collegamento, ora possono essere un’unica origine dati con due alberi, collegati dalle tabelle condivise che contengono i campi comuni.

due modelli di dati, uno composto da due origini dati distinte e uno con le due origini dati sovrapposte alle tabelle che hanno in comune per formare una singola origine dati

Suggerimento: il modo in cui le tabelle sono correlate nel modello di dati influisce sul modo in cui i relativi campi possono essere correlati nell’analisi. Può essere utile fare riferimento alla scheda Origine dati durante l’analisi per stabilire come una tabella si inserisce nel modello di dati complessivo.

Vediamo quali tabelle sono correlate, non correlate o condivise utilizzando questa origine dati di esempio. Sono presenti due alberi, uno stabilito dalla tabella di base A e uno dalla tabella di base B.

Tabelle non correlate

Le tabelle di base sono fondamentalmente indipendenti. Allo stesso modo, tutte le tabelle presenti esclusivamente in un singolo albero non sono correlate alle tabelle di altri alberi.

La tabella A e la tabella X non sono correlate

La tabella B e la tabella X non sono correlate

Un modello di dati in cui le tabelle di base A e X hanno i propri contorni. Le relazioni sono visualizzate in grigio chiaro.Un modello di dati in cui le tabelle di base A e la relativa tabella a valle B condividono una struttura. La tabella di base X ha il proprio contorno. Le relazioni sono visualizzate in grigio chiaro.

Tabelle correlate

Le tabelle nello stesso albero sono considerate correlate.

La tabella A e la tabella S sono correlate

La tabella B e la tabella S sono correlate (tramite la tabella A)

Un modello di dati in cui viene enfatizzata la relazione della tabella di base A con una tabella a valleUn modello di dati in cui la relazione della tabella B con un’altra tabella viene enfatizzata dalle relazioni con la stessa tabella di base, A

Tabelle condivise

Le tabelle condivise hanno più relazioni in entrata. Queste tabelle appartengono a più alberi e sono condivise tra di essi.

La tabella S e la tabella T sono condivise.

Un modello di dati in cui entrambe le tabelle S e T hanno più relazioni in entrata. Appartengono entrambe all’albero della tabella di base A e all’albero della tabella di base X.

Correlazione a livello di campo nell’analisi

La correlazione tra i campi viene determinata a livello di singolo foglio in base alla struttura del modello di dati, a quali campi sono attivamente in uso (ovvero, quali campi sono presenti nella visualizzazione come pillole negli spazi) e al fatto che tali campi siano dimensioni o misure. Il modo in cui la correlazione dei campi influisce sui risultati di una visualizzazione è illustrato nella sezione successiva.

Esaminiamo alcuni scenari utilizzando la stessa origine dati di esempio. Il nome di ciascun campo indica da quale tabella proviene, ad esempio CampoB della tabella B. I campi possono essere dimensioni o misure se non diversamente specificato.

Campi correlati

A livello generale, i campi sono correlati quando Tableau può determinare chiaramente come valutarli insieme in base a un percorso di relazione all’interno di un singolo albero.

Ad esempio, CampoB (della tabella B) e CampoS (della tabella S) sono correlati.

CampoB e CampoS sono correlati

Campi non correlati

A livello generale, i campi non sono correlati quando non hanno alcuna correlazione. Ciò potrebbe essere dovuto al fatto che i campi provengono da tabelle non correlate, ad esempio quando si utilizzano campi di due tabelle di base. In questo caso, i campi di diverse tabelle di base sono fondamentalmente non correlati.

Ad esempio, CampoA e CampoX non sono correlati.

CampoA e CampoX non sono correlati

In alternativa, i campi possono essere trattati come non correlati in un determinato momento, ad esempio nei casi correlati in modo ambiguo o non ancora correlati. Nella maggior parte dei casi, puoi fare affidamento sugli indicatori di correlazione per sapere quando i campi non sono correlati nel contesto di una visualizzazione.

Dimensione della congiunzione

La congiunzione è il modo in cui Tableau valuta i campi di tabelle non correlate in un modello di dati multi-fatti durante l’analisi. In una visualizzazione, l’utilizzo di una dimensione da una tabella condivisa congiunge campi altrimenti non correlati e consente di valutarli simultaneamente nella stessa visualizzazione. Possiamo pensare a questa operazione come alla giustapposizione dei risultati di due alberi in base a una dimensione che condividono.

Ad esempio, se una visualizzazione viene creata con CampoA e CampoX, questi due campi non sono correlati. L’aggiunta di DimensioneS introduce un campo di congiunzione.

  • CampoA e DimensioneS vengono valutati insieme.
  • CampoX e DimensioneS vengono valutati insieme.
  • Questi risultati intermedi vengono riuniti in base ai valori di DimensioneS.
  • CampoA e CampoX ora sono congiunti.

le tabelle di base non correlate A e X congiunte dalla tabella condivisa S

Suggerimento: una procedura consigliata consiste nell’utilizzare un campo di congiunzione nella visualizzazione prima di inserire un campo non correlato. Ad esempio, trascina prima DimensioneS oppure CampoA, quindi DimensioneS, quindi CampoX, invece di CampoA, quindi CampoX, quindi DimensioneS. L’aggiunta del campo di congiunzione garantisce che Tableau sappia sempre come valutare le relazioni ed evita potenziali problemi di prestazioni derivanti dalla valutazione congiunta di dimensioni non correlate con cross join.

La congiunzione richiede che una dimensione di una tabella condivisa sia attiva nella visualizzazione. I campi posizionati nello spazio Filtri o nella proprietà Informazioni della scheda Indicatori non sono considerati attivi ai fini della congiunzione.

Campi non ancora correlati

I campi potrebbero anche essere correlati in vari modi, ma non lo sono ancora. Ciò accade quando esiste più di una possibile relazione tra due tabelle condivise (o tabelle condivise a valle).

Considera CampoS e CampoT. Le relative tabelle sono correlate tra loro sia attraverso l’albero definito dalla tabella di base A che attraverso l’albero definito dalla tabella di base X.

In una visualizzazione che contiene solo CampoS e CampoT, non esistono informazioni su quale albero utilizzare per correlarli. In mancanza di informazioni aggiuntive, Tableau non può valutare se correlare questi campi tramite l’albero della tabella di base A o l’albero della tabella di base B.

CampoS e CampoT sono trattati come non correlati sebbene esistano più potenziali relazioni.

Campi correlati in modo ambiguo S e T

Questi campi che potrebbero essere correlati ma ancora non lo sono vengono valutati come campi non correlati perché Tableau non è in grado di determinare chiaramente il percorso di relazione. A differenza dei campi realmente non correlati che possono solo essere congiunti, i campi non ancora correlati possono essere risolti e i campi possono essere correlati direttamente.

Campi correlati in modo ambiguo

I campi possono anche essere correlati in modo ambiguo. Ciò accade quando è presente più di una possibile relazione attiva tra tabelle condivise (o tabelle condivise a valle). A differenza dei campi non ancora correlati, che possono essere considerati come ipo-correlati o sotto-correlati, i campi correlati in modo ambiguo sono iper-correlati o sovra-correlati.

Considera CampoS e CampoT. Le relative tabelle sono correlate tra loro sia attraverso l’albero definito dalla tabella di base A che attraverso l’albero definito dalla tabella di base X.

In una visualizzazione che contiene CampoA, Campo X, CampoS e CampoT, non esistono informazioni per decidere quale albero utilizzare per correlarli. In mancanza, Tableau non può valutare se correlare questi campi tramite l’albero della tabella di base A o l’albero della tabella di base B.

CampoS e CampoT vengono trattati come non correlati, nonostante vi siano molteplici relazioni attive.

Questi campi correlati in modo ambiguo vengono valutati come campi non correlati perché Tableau non è in grado di determinare chiaramente il percorso della relazione. A differenza dei campi realmente non correlati che possono solo essere congiunti, i campi correlati in modo ambiguo possono essere risolti e i campi possono essere correlati direttamente.

Misura da una tabella condivisa

Quando una dimensione viene utilizzata da una tabella condivisa, congiunge i campi delle tabelle a monte non correlate. Tuttavia, la misura non può essere congiunta e il valore di una misura dipende dalle sue dimensioni correlate.

In una visualizzazione con DimensioneA e DimensioneX, queste due dimensioni non sono correlate. Se MisuraS viene estratto dalla Tabella S, non è correlato alla combinazione congiunta di DimensioneA e DimensioneX. Sebbene possa essere correlato indipendentemente a uno dei due, non può essere correlato simultaneamente ad entrambi nella stessa visualizzazione.

le tabelle di base non correlate A e X congiunte dalla tabella condivisa S

Una misura condivisa può essere considerata un tipo di ambiguità o di sovra-correlazione e viene risolta allo stesso modo.

Risolvere relazioni poco chiare tra i campi

Ogni volta che c'è incertezza su come correlare i campi, Tableau non prenderà una decisione arbitraria ma li tratterà come se non fossero correlati. Spesso è meglio correlare questi campi chiarendo l'incertezza su quale albero utilizzare.

La risoluzione di campi non ancora correlati viene effettuata aggiungendo un campo per stabilire quale albero utilizzare. La risoluzione dei campi correlati in modo ambiguo avviene rimuovendo i campi per stabilire quale albero utilizzare.

Esempio:

Risoluzione di campi non ancora correlati: aggiungere un campo

  • In una visualizzazione con CampoS e CampoT, l’aggiunta di un campo dalla tabella A, B o C alla visualizzazione rende attivo l’albero della tabella di base A e risolve il percorso desiderato tra CampoS e CampoT.
  • In alternativa, l’utilizzo di un campo della tabella X risolve il percorso desiderato tra CampoS e CampoT con l’albero della tabella di base X.

Risoluzione di campi correlati in modo ambiguo: rimuovere un campo o più campi

  • Nella visualizzazione di CampoA, CampoX, CampoS e CampoT, la rimozione di CampoX rende attivo solo l'albero della tabella di base A e risolve il percorso desiderato tra CampoS e CampoT.
  • In alternativa, la rimozione di CampoA risolve il percorso desiderato tra CampoS e CampoT tramite l'albero della tabella di base X.

Risoluzione di una misura condivisa: rimuovere un campo o più campi

  • In una visualizzazione di DimensioneA, DimensioneX e MisuraS, la rimozione di DimensioneX rende attivo solo l'albero della tabella di base A e risolve il percorso desiderato tra DimensioneA e MisuraS.
  • In alternativa, la rimozione di DimensioneA risolve il percorso desiderato tra DimensioneX e MisuraS tramite l'albero della tabella di base X.
Non ancora correlatiCorrelati in modo ambiguoCorrelazione risolta in un unico albero
Correlati tramite la tabella di base ACorrelati tramite la tabella di base X
correlati in modo ambiguocorrelati tramite Acorrelati tramite X

La risoluzione dell’incertezza è simile all’utilizzo di un’espressione Level of Detail (LOD) FIXED. In un’espressione LOD FIXED, si indica a Tableau il livello di dettaglio a cui eseguire l’aggregazione definendo la dichiarazione della dimensione. L’incertezza viene risolta modificando la struttura della visualizzazione per rendere attivo un solo albero, in modo da indicare a Tableau quali percorsi di relazione può prendere in considerazione per eseguire l’analisi.

Congiunzione e risoluzione dell'incertezza

Sia la congiunzione che la risoluzione dell'incertezza sono modi per affrontare la non correlazione, ma hanno risultati diversi:

Congiunzione

Risolvere l'incertezza

congiunzione di A e X con S

CampoA e CampoX non correlati congiunti da DimensioneS

Risoluzione di S e T con A

CampoS e CampoT valutati attraverso l’albero definito dalla tabella di base A

Associa campi non correlati in base ad attributi condivisiRestringe il percorso di relazione da utilizzare quando sono presenti più opzioni (ambiguità o misura condivisa) oppure stabilisce un percorso di relazione quando non ce n'era uno (non ancora correlato).

Utilizza la logica con più tabelle di base per calcolare i risultati

Utilizza la logica con singole tabelle di base per calcolare i risultati

L’analisi coinvolge le tabelle non correlateL’analisi coinvolge le tabelle condivise

Come vengono utilizzati i join per ogni livello di correlazione

Dopo aver determinato la correlazione a livello di campo, Tableau deve valutare i risultati per creare la visualizzazione effettiva. Le query utilizzate per calcolare i valori mostrati in una visualizzazione si basano sui join. Il fatto che i campi siano correlati, non correlati o congiunti ha un impatto diverso sui join eseguiti. Ricorda: i campi correlati in modo ambiguo e non ancora correlati vengono trattati come non correlati in questo contesto.

Per spiegare la correlazione e i join, questa sezione illustra le tabelle e i relativi campi, oltre ai valori in tali campi. Considera il seguente modello di dati con due tabelle di base, Classes e Clubs, e una tabella condivisa, Students.

Un modello di dati con due tabelle di base, Classes e Clubs, e una tabella condivisa, Students

Classes

Clubs

Students

visualizzazione dei dati per la tabella Classes, con i valori per tre campivisualizzazione dei dati per la tabella Clubs, con i valori per tre campivisualizzazione dei dati per la tabella Students, con i valori per tre campi

Campi:

  • Class, una dimensione con i valori Nesting Basics, Advanced Songs, Flying for Fledglings e Alarm Calls 101
  • Length, una misura
  • Student, una dimensione utilizzata per la correlazione alla tabella Students

Campi:

  • Club, una dimensione con i valori Photography, Travel, Juggling, Art e First Aid
  • Dues, una misura
  • Student, una dimensione utilizzata per la correlazione alla tabella Students

Campi:

  • Bus Rider, una dimensione con valori di tipo sì o no
  • Student, una dimensione con i valori Finch, Cardinal, Sparrow, Robin e Jay. Utilizzata per la correlazione alle altre due tabelle
  • Age, una misura

Questo modello molto semplice illustra come viene calcolata la logica di join a livello generale per i modelli di dati con relazioni multi-fatti. Per maggiori informazioni sulle nozioni di base relative ai join utilizzati nei modelli di dati con singole tabelle di base basate su relazioni, consulta Funzionamento dell’analisi nelle origini dati multi-tabella che utilizzano relazioni.

Questo esempio dovrebbe essere un modello di dati con più tabelle di base?

Per questo modello di dati con tre tabelle, potrebbe essere forte la tentazione di configurarlo come un modello con singole tabelle di base, come Classes-Students-Clubs o Clubs-Students-Classes oppure con Students come tabella di base. Di norma, i modelli di dati con relazioni multi-fatti sono destinati a tipi specifici di schemi di dati o scenari di analisi. Se il tuo modello di dati presenta caratteristiche che si adattano meglio a un modello di dati con relazioni multi-fatti, configuralo in questo modo per mantenere le tabelle di base concettualmente non correlate. Tuttavia, se i dati non richiedono una struttura di questo tipo, un modello con una singola tabella di base può essere più semplice da utilizzare.

strutture di modelli di dati alternativi per il modello di esempio Classes-Clubs-Students

Modelli che potrebbero essere creati per queste tre tabelle: (1) Classes e Clubs come tabelle di base con Students come tabella condivisa, (2) in modo lineare, iniziando da Classes o Clubs e (3) Students come una singola tabella di base con Classes e Clubs come tabelle a valle.

In questo caso particolare, non c’è nulla in queste tabelle, nei dati o nel modello che richieda veramente più tabelle di base. Utilizziamo questo modello come esempio per mantenere semplice lo scenario, in modo da concentrare l’attenzione sulla logica di join. In alternativa, possiamo immaginare che sia presente un’altra tabella correlata, Rooms, che stiamo semplicemente ignorando per evitare di complicare eccessivamente la discussione.

una versione del modello Classes-Clubs-Students con una tabella condivisa aggiuntiva, Rooms

Come procedura consigliata, tuttavia, utilizza un modello con relazioni multi-fatti solo quando i dati lo richiedono.

Le dimensioni correlate utilizzano join interni

Le dimensioni correlate sono sottoposte a join interni. I join interni eliminano tutti i valori delle dimensioni che non sono condivisi in entrambe le tabelle.

  • Tableau utilizza una logica aggiuntiva per garantire che i valori delle misure non vadano persi. In questa sezione vengono utilizzate solo le dimensioni per dimostrare le nozioni di base su come Tableau applica i join interni alle dimensioni correlate.

L’esempio seguente mostra come le dimensioni correlate restituiscono solo le righe presenti nei dati. Nessuno studente frequenta il corso Alarm Calls 101, quindi non è presente nei risultati. Cardinal e Jay non frequentano alcun corso, quindi non sono presenti nei risultati.

Una visualizzazione che mostra un join interno di Class e Student, con due righe per Finch (Advanced Songs, Nesting Basics), due righe per Robin (Flying for Fledglings, Nesting Basics) e due righe per Sparrow (Advanced Songs, Nesting Basics)

Le dimensioni non correlate utilizzano i cross join

Le dimensioni non correlate (di per sé, senza una dimensione di congiunzione) vengono sottoposte a cross join.

In un cross join, ogni valore di una dimensione viene combinato con ogni valore dell’altra dimensione, anche se la combinazione risultante non è effettivamente presente nei dati. In questo esempio, il cross join aggiunge una riga per ogni possibile combinazione di Class e Club.

Una visualizzazione che mostra un cross join di Class e Club con righe per ogni combinazione di Advanced Songs/Alarm Calls 101/Flying for Fledglings/Nesting Basics with Art/First Aid/Juggling/Photography. Su entrambe le pillole delle dimensioni nello spazio Righe è visualizzata un’icona di non correlazione

È importante riconoscere quando si verifica un cross join nell’analisi. Sebbene sia presente una riga per Advanced Songs + First Aid nella tabella dei risultati per il cross join, nessuno studente partecipa effettivamente a questa combinazione di attività (ne avremo la prova nell’esempio di congiunzione nella sezione successiva).

Perché è importante riconoscere che non tutti i risultati del cross join sono basati sui dati? Immagina di dover creare una pianificazione per i corsi e le associazioni in modo che non ci siano conflitti per alcuno studente. Non ci sono studenti in Advanced Songs e First Aid, quindi potresti ignorare questo risultato e pianificare tale corso e tale associazione contemporaneamente. Il cross join non rappresenta le combinazioni di valori effettivamente presenti nei dati.

Inoltre, i cross join con elevata cardinalità (un numero elevato di valori univoci) possono avere un impatto sulle prestazioni. Immagina di sottoporre a cross join ogni numero di telefono con ogni indirizzo e-mail presente nei tuoi contatti. Ciò rappresenterebbe un'enorme esplosione di combinazioni e un'operazione potenzialmente costosa.

Le dimensioni congiunte utilizzano join esterni

Le dimensioni non correlate, in presenza di una dimensione di congiunzione, vengono sottoposte a join esterno.

In questo esempio, sia la tabella Classes che la tabella Clubs sono correlate alla tabella condivisa Students ma non tra loro, quindi i campi Class e Club non sono correlati. L’aggiunta della dimensione Student consente a Tableau di sapere quali valori di Class e quali valori di Club devono essere associati nell’analisi. Questo comportamento di join esterno è denominato congiunzione.

Una visualizzazione che mostra i risultati di un join esterno dei join interni Student-Class e Student-Club. È presente un’icona di non correlazione nelle pillole Class e Club nello spazio Righe. Una pillola per Student è presente nella proprietà Colore della scheda Indicatori e non ha un’icona non correlata. Non tutte le combinazioni di corsi e associazioni sono rappresentate e sono presenti righe per studenti e associazioni senza un corso

La congiunzione è simile alla combinazione dei dati in quanto vi sono risultati intermedi che vengono riuniti per ottenere i risultati complessivi. A differenza della combinazione, tuttavia, la congiunzione è un join esterno (non un join sinistro) e non elimina i valori da nessuno dei due lati. Non esiste il concetto di origini dati primarie o secondarie quando si utilizza un’unica origine dati, quindi a entrambi i campi non correlati viene data la stessa precedenza.

I risultati intermedi vengono sottoposti a join esterno

Quali elementi devono essere inseriti nel join esterno per i campi congiunti? Viene calcolato un join interno immediato per ciascuno dei campi non correlati e quindi per il campo di congiunzione, quindi i risultati intermedi vengono sottoposti a join esterno in base ai valori della dimensione di congiunzione.

Esempio

Un join interno per Student e Class...

Una tabella dei risultati per tre valori di Students e tre valori di Classes

...e un join interno per Student e Club...

Una tabella dei risultati per quattro valori di Students e cinque valori di Clubs

...viene quindi eseguito un join esterno su Student.

Una tabella dei risultati per quattro valori di Students, tre valori di Classes e cinque valori di Clubs

Join aggiuntivi per mantenere le misure

In aggiunta alla logica di join per le dimensioni, le misure possono introdurre ulteriori join. Quando le relazioni sono state introdotte per la prima volta in Tableau, uno dei principi fondamentali era evitare che i valori delle misure andassero perduti. Questo principio viene mantenuto anche nei modelli di dati con relazioni multi-fatti.

I dettagli essenziali sono i seguenti:

  • I valori delle misure sono ripartiti solo in base alle dimensioni correlate.
  • I valori delle misure si ripetono per le dimensioni non correlate.
  • I valori delle dimensioni che verrebbero eliminati nelle visualizzazioni con sole dimensioni possono essere restituiti se sono associati a valori delle misure rilevanti.

Nota: ricorda che le misure sono aggregazioni. Vengono calcolate al livello di dettaglio (granularità) impostato dalla combinazione di dimensioni nella visualizzazione. In questo caso, la misura è ripartita in base a una dimensione. Quando una misura viene utilizzata senza dimensioni, viene elaborata con ambito tabella. Ciò significa che il valore della misura è il valore completamente aggregato. Non appena utilizziamo una dimensione nella visualizzazione, la misura viene ripartita in modo più granulare in base ai valori della dimensione. Il valore di una misura in un’analisi dipende quindi dal contesto delle dimensioni.

Misure correlate

Considera il sottoinsieme dei valori delle dimensioni restituiti per un join interno sulle dimensioni correlate StudentClass. Ci sono tre valori per Student (Finch, Robin e Sparrow) e tre valori per Class (Advanced Songs, Nesting Basics e Flying for Fledglings).

una tabella dei risultati per un join interno tra Student e Class

Se aggiungiamo la misura Length dalla tabella Class, vediamo che vengono visualizzati tutte e quattro i corsi e c’è un valore NULL per Student. Viene visualizzata la misura Length per ogni corso, a livello di Class.

Per lo studente viene visualizzato un valore NULL anche se le dimensioni sono sottoposte a join interno

Se invece aggiungiamo la misura Age dalla tabella Students, vediamo che vengono visualizzati tutti e cinque gli studenti e sono presenti due valori NULL per Class. Nei risultati vengono mantenuti tutti gli studenti, anche se non frequentano un corso. Viene visualizzata la misura Age per ogni studente, a livello di Student.

Per i corsi viene visualizzato un valore NULL anche se le dimensioni sono sottoposte a join interno

Misure non correlate

I valori delle misure vengono ripetuti per i valori delle dimensioni non correlati.

Se esaminiamo la misura Length dalla tabella Classes e la dimensione non correlata Club, la misura ha ambito tabella e viene ripetuta in tutti i valori della dimensione Club.

una misura con ambito tabella ripetuta su valori di dimensione non correlati

In presenza di una dimensione di congiunzione, le misure possono essere sia ripartite che ripetute.

In questo caso, la misura Age proviene dalla tabella Students ed è ripartita in base al livello dello studente. Ogni volta che uno studente viene ripetuto in base alle dimensioni per Class e Club, il valore Age si ripete.

Risoluzione dei problemi

Considerazioni sull’utilizzo di modelli di dati con relazioni multi-fatti

Filtri di estrazione per tabella

Tutti i filtri di estrazione per un'estrazione di modelli di dati di relazioni multi-fatti sono per tabella (non pervasivi). Per questo motivo, i risultati del filtraggio potrebbero essere diversi tra la connessione live e quella di estrazione.

Calcoli a livello di riga

I calcoli a livello di riga possono fare riferimento solo a campi che condividono la stessa tabella di base a monte. In altre parole, i calcoli a livello di riga non possono essere eseguiti tra alberi diversi.

Campi combinati

Tutti i campi in un campo combinato devono condividere una tabella a monte. In altre parole, non è possibile creare un campo combinato utilizzando campi presenti in alberi diversi.

Insiemi

Gli insiemi possono essere creati solo con una definizione che coinvolge campi che condividono la stessa tabella di base a monte. Tuttavia, in una visualizzazione, l’opzione Aggiungi a insieme potrebbe essere resa disponibile da un indicatore quando tale indicatore è definito da campi non correlati ai campi utilizzati per definire l’insieme. Se scegli Aggiungi a insieme, Tableau aggiungerà solo i campi correlati alla definizione dell’insieme. Questo comportamento è diverso da quello di Aggiungi a insieme nelle origini dati con singole tabelle di base, quando Aggiungi a insieme aggiunge tutto ciò che definisce l’indicatore.

Convalida delle espressioni Level of Detail INCLUDE

Le espressioni LOD INCLUDE non possono essere valutate tra campi non correlati. Poiché la correlazione tra i campi viene valutata a livello di singolo foglio, è possibile avere un’espressione LOD valida nel riquadro Dati o nell’editor di calcolo che diventa non valida nel contesto di una visualizzazione specifica (in presenza di una dimensione non correlata). In tal caso, la pillola LOD diventerà di colore rosso. Puoi aggiornare l’espressione LOD per rimuovere i conflitti associati ai campi non correlati, modificare la struttura della visualizzazione o rimuovere l’espressione LOD dalla visualizzazione.

Aggiornamento delle origini dati pubblicate

Come procedura consigliata, crea una copia di un’origine dati pubblicata esistente se prevedi di trasformarla in un modello di dati con relazioni multi-fatti quando non tutte le cartelle di lavoro connesse necessitano del nuovo modello di dati. Non aggiornare la versione esistente dell’origine dati, a meno che tutte le cartelle di lavoro non necessitino delle nuove tabelle. Pubblica l’origine dati modificata come una nuova origine dati e crea nuove cartelle di lavoro a partire da essa. Ciò impedirà la conversione delle cartelle di lavoro esistenti per l’utilizzo di VDS anziché di Data Server quando non necessitano della funzionalità, evitando un potenziale calo delle prestazioni.

Problemi risolti

Problema risoltoRisolto a partire da

Estrazioni

Origine dati locale (in una cartella di lavoro): il tentativo di estrarre un’origine dati con relazioni multi-fatti genererà l’errore “Nessuna tabella di questo tipo”.

Origine dati pubblicata: l’estrazione di un’origine dati con relazioni multi-fatti pubblicata sembra avere esito positivo, ma i valori dei campi possono essere scambiati.

  • Tableau Cloud: risolto con gli aggiornamenti di metà luglio. Questo vale anche per public.tableau.com.
  • Tableau Desktop: risolto a partire dalla versione di manutenzione 2024.2.1 rilasciata il 24 luglio 2024
  • Tableau Server: risolto a partire dalla versione di manutenzione 2024.2.1 rilasciata il 24 luglio 2024

Se riscontri ancora questi problemi in Tableau Desktop o Tableau Server, esegui l'aggiornamento a una versione del 24 luglio 2024 o successiva.

Espressioni Level of Detail EXCLUDE

Solo le espressioni LOD INCLUDE dovrebbero essere convalidate in presenza di campi non correlati. Tuttavia, anche le espressioni LOD EXCLUDE potrebbero essere erroneamente contrassegnate come non valide nelle stesse condizioni.

Calcoli utente nidificati

I calcoli utente nidificati non sono disponibili nelle origini dati pubblicate con un modello di dati con relazioni multi-fatti.

Problemi noti nella versione 2024.2

Indicatori di correlazione con più schede Indicatori

Quando una visualizzazione viene creata con più misure nello spazio Righe o nello spazio Colonne, ogni misura dispone della propria scheda Indicatori. A seconda della scheda Indicatori aperta, la logica utilizzata per determinare gli indicatori di correlazione (l’icona di non correlazione, il testo nelle informazioni e la finestra di dialogo di avviso per la correlazione) potrebbe non fornire i risultati previsti. La visualizzazione stessa, tuttavia, viene calcolata correttamente in base alla correlazione di ciascuna coppia di campi. È stata pianificata una correzione per questo comportamento.

BatchQueryProcessor

BatchQueryProcessor deve essere abilitato per supportare i modelli di dati con relazioni multi-fatti. Si tratta di un comportamento previsto, per cui al momento non è stata pianificata alcuna correzione.

Tableau Pulse

Pulse potrebbe non funzionare con i modelli di dati con relazioni multi-fatti. Potrebbe non essere possibile creare una definizione di metrica oppure qualsiasi metrica creata potrebbe essere vuota. Questo non è un comportamento previsto, ma al momento non è ancora stata pianificata alcuna correzione.

Grazie per il tuo feedback.Il tuo feedback è stato inviato. Grazie!