Quando utilizzare un modello con relazioni multi-fatti
Un modello con relazioni multi-fatti è un modello di dati che consente di aggiungere tabelle non correlate in una singola origine dati e quindi utilizzare campi correlati durante l’analisi visiva per congiungere essenzialmente le tabelle in base al contesto. A differenza della combinazione, i dati sono presenti all’interno di una singola origine dati: i concetti di origini dati primarie e secondarie non si applicano e non viene eliminato alcun dato dai join di sinistra. A differenza di un modello di dati a tabella singola, più tabelle di base mantengono il proprio contesto per quanto riguarda le tabelle condivise tra loro. Un modello di dati con relazioni multi-fatti offre più opzioni per eseguire analisi multi-fatti in Tableau.
Immagina di voler analizzare la correlazione tra l’andamento del meteo e delle vendite di gelati. Sia gli eventi meteo che le vendite di gelati avvengono in orari e luoghi specifici, ma non esiste un collegamento diretto tra le vendite di gelati e il meteo. Si tratta di dati non correlati che si riferiscono entrambi ai concetti condivisi di data e posizione.
Questa domanda si presta alla creazione di un modello con relazioni multi-fatti. È possibile aggiungere sia Ice Cream Sales che Weather come tabella di base e correlarli a Date e Location, che sono tabelle condivise.
Perché è stata creata la funzionalità per modellare tabelle non correlate?
L’analisi spesso comporta la combinazione di tabelle di dati che non hanno nemmeno una relazione diretta tra loro ma che si riferiscono entrambe alle stesse informazioni comuni (come data o posizione). Un modello con relazioni multi-fatti supporta l’accoppiamento semantico libero introducendo il concetto di gradi di correlazione e la possibilità di creare un modello di dati con più tabelle di base non correlate.
L’accoppiamento semantico è un termine utilizzato per descrivere il grado di combinazione dei dati. Per join o unificazione si intende uno stretto accoppiamento semantico, in quanto entrambi combinano più tabelle in una nuova tabella fisica che funge quindi da tabella singola. Per relazione si intende un accoppiamento più flessibile tra tabelle che collega tra loro le tabelle da un punto di vista logico, mantenendone lo stato distinto come tabelle separate. Andando più avanti nello spettro dell’accoppiamento semantico si trova la combinazione dei dati, in cui i risultati provenienti da origini dati distinte vengono combinati visivamente in base a elementi condivisi tra entrambi. Un modello con relazioni multi-fatti è più vicino all’estremità di combinazione dello spettro, ma all’interno di una singola origine dati anziché tra origini dati.
Un modello con relazioni multi-fatti, ovvero un modello di dati con più tabelle di base, consente di utilizzare tabelle non correlate nel modello purché nel modello esistano anche tabelle condivise. Durante l’analisi, i campi di una tabella condivisa congiungono tabelle di dati altrimenti non correlate in base alle dimensioni condivise che hanno in comune, ad esempio il fatto che si verifichino nello stesso luogo o nello stesso momento. Tutti i vantaggi delle relazioni vengono mantenuti, inclusa la conservazione della granularità di ogni tabella o del livello di dettaglio nativo.
Analogamente a un modello di dati con tabella di base singola, Tableau determina il miglior tipo di join da utilizzare dietro le quinte in base alla struttura della visualizzazione. Ma in un modello con relazioni multi-fatti, le opzioni di join vengono ampliate e includono join esterni e cross join per gestire diversi livelli di correlazione. Per maggiori informazioni, consulta Informazioni sui modelli di dati con relazioni multi-fatti.
Da dove ha origine il nome?
Le relazioni multi-fatti prendono il nome dall’analisi multi-fatti. In un modello di data warehouse i dati vengono archiviati in una tabella dei fatti centrale circondata da tabelle delle dimensioni. In questo contesto, il termine fatto si riferisce a misurazioni o metriche, che sono campi numerici di dati che acquisiscono fatti sui dati, ovvero le misure di Tableau. Le tabelle delle dimensioni contengono attributi relativi a questi fatti.
Gli schemi basati su tabelle dei fatti sono spesso strutturati a stella o a fiocco di neve, a seconda di come sono organizzate le tabelle delle dimensioni. Quando l’analisi deve essere eseguita su tabelle dei fatti, si parla di analisi multi-fatti. L'analisi viene eseguita nel contesto delle tabelle delle dimensioni comuni, note come dimensioni condivise o dimensioni conformate. In Tableau si creano questi modelli di dati utilizzando le relazioni, per questo motivo abbiamo chiamato questa serie di funzionalità relazioni multi-fatti.
Quando utilizzare modelli di dati con relazioni multi-fatti
Se i tuoi dati sono costituiti da tabelle tutte correlate tra loro, puoi limitarti a origini dati a tabelle di base singole create con relazioni. Un modello con relazioni multi-fatti è necessario quando i dati abbracciano concetti diversi, sotto forma di più tabelle dei fatti o di contesti diversi non correlati.
Quando possibile, crea le tue origini dati con una tabella di base singola. In un modello di dati con tabella di base singola ogni tabella è correlata e non è necessario considerare i gradi di correlazione. Utilizza relazioni multi-fatti solo quando è richiesta tale struttura di modello di dati.
Analisi multi-fatti
L’analisi multi-fatti è un caso di utilizzo fondamentale per le relazioni multi-fatti in Tableau. In questo esempio, Fact A e Fact B condividono una tabella Date.
Per modellare questo in Tableau, le tabelle dei fatti diventano tabelle di base e vengono stabilite più relazioni in ingresso per la tabella delle dimensioni condivisa.
Altri scenari
Tuttavia, i modelli di dati con relazioni multi-fatti non sono destinati solo all’analisi multi-fatti. Tableau non richiede una definizione rigorosa delle tabelle dei fatti o delle dimensioni. Qualsiasi tabella può essere una tabella di base (anche se deve rispettare le caratteristiche delle tabelle di base). Alcuni scenari in cui è indicato che potrebbe essere utile un’origine dati a più tabelle di base includono:
- Spostamento tra le fasi, ad esempio tabelle di base per le domande di iscrizione, le registrazioni e gli eventi degli studenti per una tabella studenti condivisa.
- Contesti diversi per gli stessi eventi, ad esempio tabelle di base per eventi relative a visite mediche e fatture, con tabelle condivise per impostare il contesto per medici o pazienti.
- Domini diversi correlabili, ad esempio scenari che in precedenza sarebbero stati gestiti meglio con la combinazione dei dati, come la correlazione tra meteo e vendita di gelati tramite tabelle condivise per data e posizione.
Per maggiori informazioni su quando sono utili le relazioni multi-fatti, leggi questo post del blog di Tableau: When and How to Use Multi-fact Relationships in Tableau.
Identificare le tabelle di base
In un modello con relazioni multi-fatti la direzionalità è importante, vale a dire indicare quali tabelle sono le tabelle di base lungo il lato sinistro del modello e quali tabelle sono quelle condivise a valle influisce sul modo in cui le relazioni vengono valutate per restituire i risultati analitici.
Considera un papillon concettuale di fatture, appuntamenti, medici e pazienti:
Il modo corretto per creare il modello di dati in Tableau è utilizzare Invoices e Appointments come tabelle di base e Doctors e Patients come tabelle condivise (non Doctors e Patients come tabelle di base).
Modello corretto: Invoices e Appointments come tabelle di base | Modello errato: Doctors e Patients come tabelle di base |
Concettualmente il paziente (o il medico) è l’entità che congiunge l’evento di un appuntamento e l’evento di una fattura.
Se il modello di dati è al contrario (ad esempio con Doctors e Patients come tabelle di base invece di Invoices e Appointments), il comportamento di congiunzione con join esterno non sarà altrettanto utile. La tua analisi potrebbe mostrare numerose misure e ambiguità con ambito tabella. Se ti ritrovi con campi correlati in modo ambiguo non previsti, rivaluta le tabelle utilizzate come tabelle di base e verifica se è necessario invertire il modello di dati.
Caratteristiche delle tabelle base e delle tabelle condivise
Se esegui l’analisi multi-fatti, le tabelle dei fatti diventano le tabelle di base e tutte le tabelle delle dimensioni condivise sono tabelle condivise. Tableau non richiede il rispetto rigoroso delle caratteristiche delle tabella dei fatti e delle dimensioni. Tuttavia, esistono alcuni attributi che possono essere utili per identificare quali tabelle dovrebbero essere tabelle di base e quali dovrebbero essere tabelle condivise.
Tabella di base | Tabella condivisa |
Tabelle dei fatti in uno schema di data warehouse | Tabelle delle dimensioni condivise o conformi in uno schema di data warehouse |
Specifica per il contesto o l’analisi (informazioni sul volo, consumo energetico) | Concetto coerente nei diversi contesti (data, posizione) |
Notevolmente dipendente dalle misure | Principalmente dipendente dalle dimensioni |
Aggiornata più frequentemente/transazionale (visite mediche, prescrizioni, parametri vitali) | Più stabile/durevole (medico, paziente) |
Con campi della chiave esterna | Con campi della chiave primaria |
Basata su eventi (orario delle lezioni, voto a un compito) | Basata su entità (studente, classe) |
Tieni presente che se sono presenti tabelle intermedie tra una tabella di base e una tabella condivisa, puoi scambiare la tabella di base senza alterare sostanzialmente il modello di dati. come Parlor Info e Ice Cream Sales nel primo esempio. Contano quali tabelle sono a monte delle tabelle condivise e quali sono condivise.
Provare una tabella di base aggiuntiva
Esistono vari scenari che potrebbero indicare la necessità di creare un modello con relazioni multi-fatti con più tabelle di base anziché un’origine dati a tabella di base singola:
- Se stai provando a creare un’origine dati con un ciclo, la tabella a valle deve essere un’altra tabella di base.
- Se disponi di una serie di tabelle correlate agli stessi insiemi di clausole di relazione (come data e posizione), tali dimensioni devono essere estratte e trasformate in tabelle condivise.
- Ciò è particolarmente utile perché più clausole di relazione devono essere tutte vere (AND dal punto di vista logico) affinché le tabelle siano correlate per tali record.
- Se, invece, desideri analizzare record in cui le clausole possono essere vere una alla volta (OR contestuale), questa flessibilità viene offerta impostando un modello di dati con tabelle delle dimensioni condivise.
- Se utilizzi una combinazione, ma desideri una combinazione equivalente senza origini dati primarie e secondarie, crea un modello di dati che combini le origini dati della combinazione con i relativi campi di collegamento in una o più tabelle condivise.