Creare un join dei dati

Spesso è necessario combinare dati provenienti da più posizioni (tabelle o persino origini dati diverse) per eseguire l’analisi desiderata. A seconda della struttura dei dati e delle esigenze di analisi, esistono diversi modi per combinare le tabelle.

Confronto tra relazioni e join

Il metodo predefinito in Tableau Desktop è l’utilizzo delle relazioni. Le relazioni conservano il livello di dettaglio delle tabelle originali durante la combinazione delle informazioni. Le relazioni consentono inoltre di eseguire join basati sul contesto a livello di singolo foglio, rendendo ogni origine dati più flessibile. Le relazioni sono il metodo consigliato per combinare i dati nella maggior parte dei casi. Per maggiori informazioni, consulta Differenze tra le relazioni e i join.

Tuttavia, in alcuni casi può essere utile eseguire direttamente un join, sia per il controllo che per i vantaggi offerti da un join rispetto a una relazione, come i filtri o la duplicazione.

Nota: le relazioni utilizzano i join, ma dietro le quinte. Ad esempio, una relazione tra origini dati produrrà un join tra database quando la visualizzazione utilizza campi da tabelle in origini dati diverse. Di conseguenza, Migliorare le prestazioni per i join tra database può essere rilevante.

Problemi comuni

  • Per visualizzare, modificare o creare join, devi aprire una tabella logica nel canvas delle relazioni (l’area visualizzata quando apri o crei un’origine dati per la prima volta) e accedere al canvas di join.
  • Le origini dati pubblicate di Tableau non possono essere utilizzate nei join. Per combinare origini dati pubblicate, devi modificare le origini dati originali affinché contengano in modo nativo il join o utilizzare una combinazione di dati.
  • Quando crei un join di tabelle, i campi per cui viene creato il join devono avere lo stesso tipo di dati. Se modifichi il tipo di dati dopo aver creato un join di tabelle, il join si interromperà.
  • I campi utilizzati nella clausola di join non possono essere rimossi senza interrompere il join. Per eseguire il join dei dati ed essere in grado di pulire i campi duplicati, utilizza Tableau Prep Builder anziché Desktop

Suggerimento: anche se Tableau Desktop offre la possibilità di creare join ed eseguire alcune modellazioni dei dati di base, Tableau Prep Builder è progettato per la preparazione dei dati. Se devi eseguire più join, pulire i nomi dei campi, modificare i tipi di dati, eseguire più pivot o altre attività di preparazione dei dati, prendi in considerazione l’utilizzo di Tableau Prep Builder(Il collegamento viene aperto in una nuova finestra).

Creare un join

  1. Per creare un join, connettiti a una o più origini dati pertinenti. Vedi Connettersi ai dati.

    I dati possono essere nella stessa origine dati (ad esempio, tabelle in un database o fogli in un foglio di calcolo di Excel) o in origini dati diverse (denominato join tra database). Se hai combinato le tabelle utilizzando un join tra database, Tableau colora le tabelle nel canvas e le colonne nella griglia di dati per mostrare da che connessione provengono i dati.

    Nota: non tutte le origini dati supportano i join tra database, incluse le origini dati pubblicate di Tableau. Per combinare origini dati pubblicate, modifica le origini dati originali affinché contengano in modo nativo il join o utilizza una combinazione di dati.

  2. Trascina la prima tabella nel canvas.

    Tieni presente che se trascini una seconda tabella in questo punto si formerà una relazione.

  3. Seleziona Apri dal menu o fai doppio clic sulla prima tabella per aprire il canvas di join (livello fisico).

    Facendo doppio clic su una tabella nel canvas delle relazioni, viene aperto il canvas di join

  4. Fai doppio clic o trascina un’altra tabella nel canvas di join.

    Se la tabella successiva è interamente in un’altra origine dati, nel riquadro di sinistra, in Connessioni, fai clic sul pulsante Aggiungi ( nel Web authoring) per aggiungere una nuova connessione all’origine dati Tableau. Con la connessione selezionata, trascina la tabella desiderata nel canvas di join.

  5. Fai clic sull’icona di join per configurare il join. Aggiungi una o più clausole di join selezionando un campo da una delle tabelle disponibili utilizzate nell’origine dati, quindi scegliendo un operatore di join e un campo dalla tabella aggiunta.

    Nota: puoi eliminare una clausola del join facendo clic sulla "x" che viene visualizzata quando posizioni il puntatore del mouse sul lato destro della clausola del join.

  6. Al termine, chiudi la finestra di dialogo di join e il canvas di join.

Dopo aver creato un join, Creare un join dei dati. Per risolvere i problemi del join, consulta Creare un join dei dati.

Anatomia di un join

I join sono definiti dal tipo e dalla clausola di join.

Tipi di join

In generale, esistono quattro tipi di join che puoi utilizzare in Tableau: interno, sinistro, destro ed esterno completo. Se non sei certo del tipo di join da utilizzare per combinare i dati di più tabelle, è consigliabile utilizzare le relazioni.

Tipo di joinRisultato

Inner

Quando utilizzi un join interno per combinare tabelle, il risultato è una tabella che contiene valori che hanno corrispondenze in entrambe le tabelle.

Quando un valore non corrisponde in entrambe le tabelle, viene eliminato completamente.

Sinistro

Quando utilizzi un join sinistro per combinare le tabelle, il risultato è una tabella che contiene tutti i valori della tabella di sinistra e le corrispondenze della tabella di destra.

Quando un valore nella tabella di sinistra non ha una corrispondenza nella tabella di destra, viene visualizzato un valore NULL nella griglia di dati.

Destro

Quando utilizzi un join destro per combinare le tabelle, il risultato è una tabella che contiene tutti i valori della tabella di destra e le corrispondenze della tabella di sinistra.

Quando un valore nella tabella di destra non ha una corrispondenza nella tabella di sinistra, viene visualizzato un valore NULL nella griglia di dati.

Esterno completo

Quando utilizzi un join esterno completo per combinare le tabelle, il risultato è una tabella che contiene tutti i valori di entrambe le tabelle.

Quando un valore di una delle tabelle non ha una corrispondenza nell’altra tabella, viene visualizzato un valore NULL nella griglia di dati.

Unificazione

Sebbene l’unificazione non sia un tipo di join, è un altro metodo per combinare due o più tabelle aggiungendo righe di dati da una tabella all’altra. In teoria, le tabelle unificate hanno lo stesso numero di campi e questi campi hanno nomi e tipi di dati corrispondenti. Per maggiori informazioni sull’unificazione, consulta Unificare i dati.

Non tutti i database supportano tutti i tipi di join. Se un’opzione non è disponibile nella finestra di dialogo di join, è probabile che ciò sia dovuto a un vincolo dell’origine dati.

Clausole di join

Un join viene eseguito impostando una o più clausole di join. La clausola di join indica a Tableau quali campi sono condivisi tra le tabelle e come abbinare le righe corrispondenti. Ad esempio, le righe con lo stesso ID vengono allineate nella tabella dei risultati.

Le clausole di join in genere utilizzano l’operatore di uguaglianza (=), che esegue l’abbinamento delle righe con gli stessi valori. È anche possibile eseguire join non di uguaglianza, ad esempio minore di (<) e diverso da (<>).

Un join può anche avere più clausole di join. Ad esempio, se nome e cognome sono memorizzati in colonne distinte, potrebbe essere utile eseguire il join solo se "Nome = Nome" e "Cognome = Cognome". Entrambe le condizioni dovranno essere vere perché venga effettuato il join delle righe. In alternativa, se l’obiettivo fosse quello di restituire risultati quando il cognome è condiviso ma il nome non lo è, le clausole di join potrebbero essere "Nome <> Nome" e "Cognome = Cognome".

Le clausole di join possono anche contenere calcoli. Ad esempio, la clausola di join potrebbe essere la concatenazione dei campi nome "[Nome] + [Cognome] = [Nome] + [Cognome]". Tieni presente che non tutte le connessioni di origini dati supportano i calcoli nelle clausole di join.

Informazioni sui valori NULL nelle chiavi di join

In generale, i join vengono eseguiti a livello di database. Se i campi utilizzati per eseguire il join delle tabelle contengono valori NULL, la maggior parte dei database restituisce i dati senza le righe che contengono i valori NULL. Tuttavia, per alcune origini dati a connessione singola, Tableau fornisce un’opzione aggiuntiva che consente di eseguire il join di campi che contengono valori Null con altri campi che includono valori Null.

Dopo aver configurato l’origine dati, nella pagina Origine Dati seleziona Dati > Crea un join tra valori NULL e valori NULL.

Se l’opzione è disattivata, non è disponibile per l’origine dati. Tieni presente che se aggiungi una seconda connessione a un’origine dati che utilizza questa opzione, il join torna al comportamento predefinito di esclusione delle righe con valori Null.

Join tra database

Tableau consente join da tabelle in origini dati diverse, anche se con alcune limitazioni sul lato database rispetto alle piattaforme compatibili. I join tra database richiedono un’origine dati multi-connessione, ovvero la creazione di una nuova connessione a ogni database prima di creare il join delle tabelle.

  1. Dopo aver eseguito la connessione alla prima origine dati, utilizza l’opzione Aggiungi nel riquadro Dati per aggiungere un’altra connessione.

    Nota: se il connettore desiderato non è disponibile nell’elenco Connetti quando tenti di aggiungere un’altra connessione, i join tra database non sono supportati per la combinazione di origini che vuoi unire. Questo include le connessioni ai dati del cubo (ad esempio, Microsoft Analysis Services), la maggior parte dei dati di estrazione (ad esempio, Google Analytics e OData) e le origini dati pubblicate di Tableau Server.

  2. In questo modo, viene creata una seconda connessione anziché un’origine dati completamente diversa. Puoi passare da una all’altra delle due (o più) connessioni mentre ti trovi nella scheda dell’origine dati.

  3. Una volta che ti sposti in un foglio di lavoro e inizi l’analisi, l’origine dati funziona come un’unica origine dati combinata. Questo è in contrasto con due origini dati indipendenti che possono essere alternate in un foglio di lavoro.

    L’origine dati Book+ contiene due connessioni con un join tra database. Funziona come una singola origine dati. L’origine dati Movie adaptations è un’origine dati indipendente.

Nota: in genere, la creazione di join di tabelle dello stesso database offre prestazioni migliori. Ciò è dovuto al fatto che l’esecuzione di query sui dati archiviati nello stesso database richiede meno tempo e utilizza le funzionalità native del database per eseguire il join. Per maggiori informazioni sulle prestazioni dei join tra database, consulta Migliorare le prestazioni per i join tra database.

 

Grazie per il tuo feedback.Il tuo feedback è stato inviato. Grazie!