Correlare i dati

Le relazioni sono un modo flessibile e dinamico per combinare i dati di più tabelle per l'analisi. Una relazione descrive come due tabelle si relazionano tra loro in base a campi comuni, ma non comporta l'unione delle tabelle. Quando si crea una relazione tra le tabelle, le tabelle rimangono separate, mantenendo il proprio livello di dettaglio e i propri domini.

Puoi considerare una relazione come un contratto tra due tabelle. Quando si compila una vista con i campi di queste tabelle, Tableau include i dati di queste tabelle utilizzando tale contratto per creare una query con i join appropriati.

Ulteriori informazioni: la possibilità di correlare i dati è una caratteristica importante delle nuove funzionalità di modellazione dei dati di Tableau. Per maggiori informazioni, consulta Elementi modificati per le origini dati e l'analisi. Scopri di più sul funzionamento delle relazioni in questi post di blog di Tableau:

Guarda un video: per una panoramica dei miglioramenti delle origini dati e un'introduzione all'utilizzo delle relazioni in Tableau, guarda questo video di 5 minuti.

Che cosa sono le relazioni?

Le relazioni sono le linee di collegamento flessibili che vengono create tra le tabelle logiche nell'origine dati. Anche se alcune persone preferiscono chiamarle "noodle", noi in genere le definiamo "relazioni" nella nostra documentazione.

È consigliabile utilizzare le relazioni come primo approccio per combinare i dati perché semplificano e rendono più intuitive la preparazione e l'analisi dei dati. Utilizza i join solo quando è assolutamente necessario(Link opens in a new window).

Le relazioni offrono diversi vantaggi rispetto all'utilizzo dei join per i dati in più tabelle:

  • Non è necessario configurare i tipi di join tra le tabelle. È sufficiente selezionare i campi per definire la relazione.
  • Le tabelle correlate rimangono separate e distinte: non vengono unite in una singola tabella.
  • Le relazioni utilizzano i join, ma in modo automatico. Tableau seleziona automaticamente i tipi di join in base ai campi utilizzati nella visualizzazione. Durante l'analisi, Tableau regola i tipi di join in modo intelligente e mantiene il livello di dettaglio nativo nei dati.
  • Tableau utilizza le relazioni per generare le aggregazioni corrette e i join appropriati durante l'analisi, in base al contesto corrente dei campi in uso in un foglio di lavoro.
  • In un'unica origine dati sono supportate più tabelle a diversi livelli di dettaglio. Puoi creare modelli di dati contenenti più tabelle e ridurre il numero di origini dati necessarie per creare una vista.
  • I valori delle misure non corrispondenti non vengono eliminati (nessuna perdita accidentale di dati).
  • Evita la duplicazione dei dati e i problemi di filtro che talvolta possono derivare dai join.
  • Tableau genererà query solo per i dati rilevanti per la vista corrente.

Requisiti per le relazioni

  • Quando crei una correlazione tra tabelle, i campi che definiscono le relazioni devono avere lo stesso tipo di dati.
  • Non puoi definire relazioni basate su campi geografici.
  • Le relazioni circolari non sono supportate nel modello di dati.
  • Non puoi modificare le relazioni in un'origine dati pubblicata.
  • Non puoi definire relazioni tra origini dati pubblicate.
  • La cartella di lavoro deve utilizzare un'origine dati incorporata per poter modificare le relazioni e le opzioni relative alle prestazioni nella pagina Origine dati in Tableau Online o Tableau Server.

Fattori che limitano i vantaggi dell'utilizzo delle tabelle correlate:

  • La presenza di dati sporchi nelle tabelle (ovvero, tabelle che non sono state create tenendo presente un modello ben strutturato e contengono una combinazione di misure e dimensioni in più tabelle) può rendere più complessa l'analisi multi-tabella.
  • L'utilizzo di filtri dell'origine dati limiterà la capacità di Tableau di eseguire la selezione per join nei dati. La selezione per join è un'espressione che fa riferimento al modo in cui Tableau semplifica le query rimuovendo i join non necessari.
  • Tabelle con molti valori non corrispondenti tra le relazioni.
  • Interrelazione di più tabelle dei fatti con più tabelle delle dimensioni (tentativo di modellare dimensioni condivise o conformi).

Dati che non possono essere correlati

La maggior parte dei tipi di connessioni relazionali è completamente supportata. Cubi, SAP HANA (con l'attributo OLAP), JSON e Google Analytics sono limitati a una singola tabella logica in Tableau 2020.2. Le stored procedure possono essere utilizzate solo all'interno di una singola tabella logica.

Le origini dati pubblicate non possono essere correlate tra loro. Inoltre, non puoi modificare le origini dati pubblicate.

Non supportati

  • I database cubo non supportano il nuovo livello logico. La connessione a un cubo offre la stessa esperienza precedente alla versione 2020.2.
  • Stored procedure: non supportano la federazione, le relazioni o i join. Sono rappresentate in una singola tabella logica e non consentono l'apertura del canvas di join/unione (livello fisico).
  • Splunk: non supporta i join a sinistra (e quindi le tabelle logiche).
  • JSON: non supporta la federazione, SQL personalizzato, i join o le relazioni (solo le unioni).
  • Origini dati che non supportano i calcoli LOD. Per maggiori informazioni, consulta Vincoli dell'origine dati per le espressioni Level of Detail.

Supporto limitato

  • Connessioni standard Salesforce e WDC: sono rappresentate come tabelle sottoposte a join all'interno di una tabella logica. L'aggiunta di queste connessioni è attualmente supportata solo per le origini dati con una singola tabella logica. Le connessioni standard non possono essere unite in join a una tabella esistente.
  • SAP HANA: attualmente non supporta la correlazione delle tabelle logiche quando per la connessione è impostato l'attributo OLAP.

Creare e definire relazioni

Dopo aver trascinato la prima tabella sul canvas principale dell'origine dati, ogni nuova tabella che trascini sul canvas deve essere collegata a una tabella esistente. Quando crei relazioni tra tabelle nel livello logico, stai creando il modello di dati per l'origine dati.

Nota: non puoi modificare il modello di dati di un'origine dati pubblicata.

Creare una relazione

Le relazioni vengono create nel livello logico dell'origine dati. Si tratta della vista predefinita del canvas visualizzata nella pagina Origine dati.

  1. Trascina una tabella nel canvas.

  2. Trascina una tabella nel canvas. Quando vedi il "noodle" tra le due tabelle, rilascia la tabella.

    Verrà visualizzata la finestra di dialogo Modifica relazione. Tableau tenta automaticamente di creare la relazione in base ai vincoli di chiave esistenti e ai campi corrispondenti per definire la relazione. Se non è in grado di determinare i campi corrispondenti, sarà necessario selezionarli.

    Se non viene rilevato alcun vincolo, viene creata una relazione Molti-a-molti e l'integrità referenziale viene impostata su Alcuni record corrispondono. Queste impostazioni predefinite rappresentano una scelta sicura e offrono la massima flessibilità per l'origine dati. Le impostazioni predefinite supportano i full outer join e ottimizzano le query aggregando i dati della tabella prima di formare i join durante l'analisi. Tutti i dati delle colonne e delle righe di ogni tabella diventano disponibili per l'analisi.

    Nota: in molti scenari analitici, utilizzando le impostazioni predefinite per una relazione si ottengono tutti i dati necessari per l'analisi. L'utilizzo di una relazione molti-a-molti funzionerà anche se i dati sono effettivamente molti-a-uno o uno-a-uno. Se conosci la cardinalità e l'integrità referenziale dei dati, puoi modificare le impostazioni delle opzioni per le prestazioni(Link opens in a new window) per descrivere i dati in modo più accurato e ottimizzare le query sul database eseguite da Tableau.

    Per modificare i campi, seleziona una coppia di campi, quindi fai clic nell'elenco dei campi sottostante per selezionare una nuova coppia di campi corrispondenti.

    Per aggiungere più coppie di campi: dopo aver selezionato la prima coppia, fai clic su Chiudi e quindi su Aggiungi altri campi.

  3. Aggiungi altre tabelle seguendo la stessa procedura, in base alle esigenze.

Dopo aver creato l'origine dati correlata multi-tabella, puoi iniziare a esplorare i dati. Per maggiori informazioni, consulta Funzionamento dell'analisi nelle origini dati multi-tabella che utilizzano relazioni e Risoluzione dei problemi relativi all'analisi multi-tabella.

Spostare una tabella per creare una relazione diversa

Per spostare una tabella, trascinala accanto a un'altra tabella. In alternativa, passa il puntatore su una tabella, fai clic sulla freccia e quindi seleziona Sposta.

Suggerimento: trascina una tabella sopra un'altra tabella per sostituirla.

Rimuovere una tabella da una relazione

Per rimuovere una tabella, passa il puntatore su una tabella, fai clic sulla freccia e quindi seleziona Rimuovi.

Visualizzare una relazione

  • Passa il puntatore del mouse sulla linea di relazione (noodle) per vedere i campi corrispondenti che la definiscono. Puoi anche passare il puntatore su qualsiasi tabella logica per visualizzarne il contenuto.


Modificare una relazione

  • Fai clic su una linea di relazione per aprire la finestra di dialogo Modifica relazione. Puoi aggiungere, modificare o rimuovere i campi utilizzati per definire la relazione. Aggiungi ulteriori coppie di campi per creare una relazione composta.

    Per aggiungere più coppie di campi: dopo aver selezionato la prima coppia, fai clic su Chiudi e quindi su Aggiungi altri campi.

Suggerimenti sulla creazione di relazioni

  • La prima tabella trascinata sul canvas diventa la tabella radice per il modello di dati nell'origine dati. Dopo aver trascinato la tabella radice, puoi trascinare altre tabelle in qualsiasi ordine. Dovrai considerare quali tabelle devono essere correlate tra loro e le coppie di campi corrispondenti da definire per ogni relazione.
  • Prima di iniziare a creare le relazioni, la visualizzazione dei dati dall'origine dati prima o durante l'analisi può essere utile per avere un'idea dell'ambito di ogni tabella. Per ulteriori informazioni, consulta Visualizzare i dati sottostanti. Puoi anche utilizzare Visualizza dati per visualizzare i dati sottostanti di una tabella quando una relazione non è valida.
  • Se stai creando uno schema a stella, può essere utile trascinare prima la tabella dei fatti e quindi correlare le tabelle delle dimensioni a tale tabella.
  • Ogni relazione deve essere formata da almeno una coppia di campi corrispondenti. Aggiungi più coppie di campi per creare una relazione composta. Le coppie associate devono avere lo stesso tipo di dati. La modifica del tipo di dati nella pagina Origine dati non modifica questo requisito. Tableau continuerà a utilizzare il tipo di dati nel database sottostante per le query.
  • Le relazioni possono essere basate su campi calcolati. Puoi anche specificare come confrontare i campi usando gli operatori quando definisci la relazione.
  • L'eliminazione di una tabella nel canvas comporta automaticamente anche l'eliminazione dei discendenti correlati. Se elimini la tabella radice, vengono rimosse anche tutte le altre tabelle nel modello.

Convalidare le relazioni nell'origine dati

Sono disponibili diverse opzioni per la convalida del modello di dati per l'analisi. Durante la creazione del modello per l'origine dati, è consigliabile passare al foglio, selezionare l'origine dati e quindi creare una vista per esplorare i conteggi dei record, i valori non corrispondenti, i valori Null o i valori delle misure ripetuti. Prova a utilizzare i campi di tabelle diverse per assicurarti che tutti gli elementi si presentino come previsto.

Cosa cercare:

  • Le relazioni nel modello di dati utilizzano i campi corrispondenti corretti per le relative tabelle?
  • Quali sono i risultati del trascinamento di dimensioni e misure diverse nella vista?
  • Viene visualizzato il numero previsto di righe?
  • Le relazioni composte renderebbero la relazione più accurata?
  • Se hai modificato le impostazioni predefinite per le impostazioni delle opzioni per le prestazioni, vengono visualizzati i valori previsti nella vista? In caso contrario, puoi controllare le impostazioni o ripristinare le impostazioni predefinite.

Opzioni per la convalida delle relazioni e del modello di dati:

  • Ogni tabella include un conteggio dei relativi record, in un campo denominato NomeTabella(Conteggio), al livello di dettaglio per tale tabella. Per visualizzare il conteggio per una tabella, trascina il relativo campo Conteggio nella vista. Per visualizzare il conteggio per tutte le tabelle, seleziona il campo Conteggio per ogni tabella nel riquadro Dati e quindi fai clic su Tabella di testo in Mostra.
  • Fai clic su Visualizza dati nel riquadro Dati per visualizzare il numero di righe e dati per ogni tabella. Inoltre, prima di iniziare a creare le relazioni, la visualizzazione dei dati dall'origine dati prima o durante l'analisi può essere utile per avere un'idea dell'ambito di ogni tabella. Per ulteriori informazioni, consulta Visualizzare i dati sottostanti.
  • Trascina le dimensioni in Righe per visualizzare il numero di righe nella barra di stato. Per visualizzare i valori non corrispondenti, fai clic sul menu Analisi, quindi seleziona Layout tabella > Mostra righe vuote o Mostra colonne vuote. Puoi anche trascinare misure diverse nella vista, ad esempio <Tabella>(Conteggio), da una delle tabelle rappresentate nella vista. In questo modo, verranno visualizzati tutti i valori delle dimensioni di tale tabella.

Suggerimento: se desideri visualizzare le query generate per le relazioni, puoi utilizzare la registrazione delle prestazioni in Tableau Desktop.

  1. Fai clic sul menu Guida, quindi seleziona Impostazioni e prestazioni > Avvia registrazione delle prestazioni.
  2. Trascina i campi nella vista per creare la visualizzazione.
  3. Fai clic sul menu Guida, quindi seleziona Impostazioni e prestazioni > Interrompi registrazione delle prestazioni.
  4. Nella dashboard Riepilogo delle prestazioni, in Eventi ordinati in base al tempo, fai clic su una barra "Esecuzione della query" e visualizza la query sottostante.

Un'altra opzione più avanzata consiste nell'utilizzare il Visualizzatore di log Tableau(Link opens in a new window) su GitHub. Puoi applicare filtri in base a una parola chiave specifica utilizzando end-protocol.query. Per altre informazioni, inizia con la pagina wiki del Visualizzatore di log Tableau(Link opens in a new window) su GitHub.

Visualizzazioni solo con dimensioni

Quando usi un'origine dati multi-tabella con tabelle correlate, se crei una visualizzazione solo con dimensioni, Tableau utilizza inner join e non sarà visibile l'intero dominio senza corrispondenza.

Per visualizzare combinazioni parziali dei valori delle dimensioni, puoi:

  • Utilizza Mostra righe/colonne vuote per visualizzare tutte le righe possibili. Fai clic sul menu Analisi, quindi seleziona Layout tabella > Mostra righe vuote o Mostra colonne vuote.
  • Aggiungi una misura alla vista, ad esempio <Tabella>(Conteggio), da una delle tabelle rappresentate nella vista. In questo modo, verranno visualizzati tutti i valori delle dimensioni di tale tabella.

Per maggiori informazioni, consulta Funzionamento dell'analisi nelle origini dati multi-tabella che utilizzano relazioni e Risoluzione dei problemi relativi all'analisi multi-tabella.

Confronto tra relazioni (tabelle logiche) e join (tabelle fisiche)

Benché presentino delle somiglianze, i join e le relazioni si comportano in modo diverso in Tableau e sono definiti in diversi livelli del modello di dati. Le relazioni vengono create tra le tabelle logiche nel livello logico principale dell'origine dati. I join vengono creati tra le tabelle fisiche nel livello fisico dell'origine dati.

I join uniscono i dati di due tabelle in un'unica tabella prima di iniziare l'analisi. L'unione delle tabelle può causare la duplicazione o il filtraggio dei dati da una o entrambe le tabelle, nonché determinare l'aggiunta di righe NULL ai dati se si utilizza un join esterno sinistro, destro o completo. Quando si effettua l'analisi di dati sottoposti a join, è necessario assicurarsi di gestire correttamente gli effetti del join sui dati.

Nota: in alcuni casi, gli effetti di duplicazione o filtraggio di un join potrebbero essere desiderabili (ad esempio, quando si esegue il join di una tabella dei diritti per implementare la sicurezza a livello di riga). In questi casi, è consigliabile utilizzare i join per unire le tabelle invece di usare le relazioni. Fai doppio clic su una tabella logica per aprire il livello fisico e aggiungere le tabelle unite in join.

Una relazione descrive come due tabelle indipendenti si relazionano tra loro, ma non comporta l'unione delle tabelle. Questo evita i problemi di duplicazione e di filtraggio dei dati che potrebbero verificarsi con un join e può facilitare l'utilizzo dei dati.

relazioni join
Definite tra le tabelle logiche nel canvas delle relazioni (livello logico) Definiti tra le tabelle fisiche nel canvas di join/unione (livello fisico)
Non richiedono la definizione di un tipo di join Richiedono la pianificazione dei join e il tipo di join
Operano come contenitori per le tabelle sottoposte a join o unione Vengono uniti nella relativa tabella logica
Vengono interrogati solo i dati rilevanti per la vista È possibile regolare le impostazioni della cardinalità e dell'integrità referenziale per ottimizzare le query. Eseguiti come parte di ogni query
Il livello di dettaglio è a livello di aggregazione per la vista Il livello di dettaglio è a livello di riga per la singola tabella
I tipi di join vengono formati automaticamente da Tableau in base al contesto dell'analisi. Tableau determina i join necessari in base alle misure e alle dimensioni nella vista. I tipi di join sono statici e fissi nell'origine dati, indipendentemente dal contesto dell'analisi. I join e le unioni vengono stabiliti prima dell'analisi e non cambiano.
Le righe non vengono duplicate I dati delle tabelle unite possono generare una duplicazione
I record non corrispondenti sono inclusi nelle aggregazioni, a meno che non siano esclusi in modo esplicito I record non corrispondenti vengono omessi dai dati uniti
Creano domini indipendenti con più livelli di dettaglio. Supportano gli scenari che richiedono una singola tabella di dati, come filtri di estrazione, sicurezza a livello di riga o aggregazione

Confronto tra relazioni e combinazioni

Sebbene le relazioni e le combinazioni supportino analisi a diversi livelli di dettaglio, presentano alcune differenze. Uno dei motivi per cui potrebbe essere preferibile utilizzare le combinazioni anziché le relazioni è allo scopo di combinare origini dati pubblicate per l'analisi.

 

relazioni combinazioni
Definite nell'origine dati Definite nel foglio di lavoro tra un'origine dati primaria e un'origine dati secondaria
Possono essere pubblicate Non possono essere pubblicate
Tutte le tabelle sono semanticamente uguali Dipendono dalla selezione delle origini dati primarie e secondarie e dalla struttura di tali origini dati.
Supportano i full outer join Supportano solo i join a sinistra
Calcolate in locale Calcolate come parte della query SQL
I campi correlati sono fissi I campi correlati variano in base al foglio (possono essere personalizzati a livello di singolo foglio)

Funzionalità delle diverse opzioni per la combinazione dei dati: relazioni, join e combinazioni

Esistono diversi modi per combinare le tabelle dei dati, ognuno con particolari caratteristiche e adatto per specifici scenari.

Relazione

Utilizza questa opzione per combinare dati con diversi livelli di dettaglio.

  • Richiede campi corrispondenti tra due tabelle logiche. Più coppie di campi corrispondenti possono definire la relazione.
  • Utilizza automaticamente le aggregazioni e i join contestuali corretti in base al modo in cui vengono correlati e utilizzati i campi nella vista.
  • Supporta join esterni e molti-a-molti.
  • Le relazioni sono coerenti per l'intera cartella di lavoro e possono essere pubblicate.
  • Può essere pubblicata, ma non è possibile correlare l'origine dati pubblicata o modificare le relazioni nelle origini dati pubblicate.
  • Non puoi definire relazioni basate su campi calcolati o campi geografici.
  • L'utilizzo di filtri per l'origine dati limita i vantaggi della selezione per join delle relazioni.
Join

Utilizza questa opzione quando desideri aggiungere altre colonne di dati nella stessa struttura di righe.

  • Richiede campi comuni tra due tabelle fisiche.
  • Richiede la creazione di una clausola di join e di un tipo di join.
  • Puoi eseguire un join su un calcolo.
  • Le tabelle fisiche sottoposte a join vengono unite in un'unica tabella logica con una combinazione fissa di dati.
  • Può causare una perdita di dati se i campi o i valori non sono presenti in tutte le tabelle (a seconda dei tipi di join utilizzati).
  • Può causare la duplicazione dei dati se i campi hanno diversi livelli di dettaglio.
  • Consente di utilizzare i filtri dell'origine dati.
Unione

Utilizza questa opzione quando desideri aggiungere più righe di dati con la stessa struttura di colonne.

  • Basata sulle colonne corrispondenti tra due tabelle.
  • Le tabelle fisiche unificate vengono unite in un'unica tabella logica con una combinazione fissa di dati.
Combinazione

Utilizza questa opzione per combinare dati con diversi livelli di dettaglio.

  • Può essere utilizzata per combinare origini dati pubblicate, ma non può essere pubblicata.
  • Può essere utilizzata tra un'origine dati relazionale e un'origine dati del cubo.
  • Le origini dati possono essere combinate a livello di singolo foglio.
  • Sono sempre effettivamente join a sinistra (possono verificarsi perdite di dati da origini dati secondarie).

Altri articoli in questa sezione

Grazie per il tuo feedback. Si è verificato un errore durante l'invio del feedback. Riprova o scrivici.