Migliorare le prestazioni per i join tra database

Importante: questa funzionalità sposta temporaneamente i dati all’esterno di Tableau. Assicurati che il database a cui sei connesso provenga da una fonte attendibile.

Puoi migliorare le prestazioni durante il join di dati da un singolo file e un singolo database consentendo a Tableau di eseguire il join utilizzando il database invece di Hyper. Quando questa opzione è abilitata, Tableau sceglie l’opzione più veloce (Hyper o il database collegato). Se Tableau utilizza il database collegato, i dati dalla connessione del file vengono spostati in tabelle temporanee nel database e il join viene eseguito lì.

Condizioni per la funzionalità

Questa opzione è disponibile solo se vengono soddisfatte le seguenti condizioni:

  • L’origine dati è costituita da una o più connessioni basate su file e da una singola connessione basata su SQL.
  • Il file è di tipo Microsoft Excel, PDF o di testo (.csv, .txt, .tsv o .tab).
  • Il database collegato è uno dei seguenti:
    • Microsoft SQL Server
    • Oracle
    • PostgreSQL
    • Vertica
    • Teradata
  • Il tipo di join è un join interno.
  • Nella progettazione sul Web: l’opzione Consenti agli utenti di utilizzare la progettazione sul Web è attivata.

Sostituzione delle condizioni per la funzionalità

In qualità di amministratore, puoi ignorare le limitazioni relative alle dimensioni dei file, al tipo di join e alla connessione a un singolo file e forzare Tableau a utilizzare il database live per eseguire il join. In questo modo, è possibile sperimentare e determinare le configurazioni ottimali per le prestazioni. Il requisito di connessione a un singolo database è comunque valido.

Per attivare questa opzione, immetti le seguenti informazioni dalla riga di comando:

  • Tableau Desktop: immetti il comando tableau.exe -DForceAlternativeFederationEngine=true
  • Tableau Server: immetti il comando di configurazione tsm tsm configuration set -k native_api.force_alternative_federation_engine -v true

    Per maggiori informazioni sull’impostazione dei valori di configurazione in Tableau Server, consulta Opzioni di tsm configuration set(Il collegamento viene aperto in una nuova finestra) nella Guida di Tableau Server.

Abilita l’opzione delle prestazioni per i join tra database

  1. Connettiti alla prima origine dati.
    • In Tableau Desktop: nella pagina iniziale, sotto Connetti, connettiti a un tipo di file supportato o a un tipo di database supportato. Questo passaggio crea il primo collegamento nell’origine dati di Tableau.
    • Nella progettazione sul Web: dalla pagina Home o Esplora, fai clic su Crea > Cartella di lavoro per avviare una nuova cartella di lavoro e quindi connetterti ai tuoi dati. Questo passaggio crea il primo collegamento nell’origine dati di Tableau.
  2. Seleziona il file o il database a cui connetterti, quindi fai doppio clic o trascina una tabella nel canvas.

  3. Nel riquadro di sinistra, in Connessioni, fai clic sul pulsante Aggiungi ( nella progettazione sul Web) per aggiungere una seconda connessione all’origine dati Tableau.

    Verrà visualizzata l’opzione Join tra database.

    Nota: se non viene visualizzata questa opzione, verifica di utilizzare solo origini dati supportate e che ne siano presenti solo due (un file e un tipo di database). In caso contrario, l’amministratore del sito potrebbe aver impostato l’opzione di configurazione Join tra database su Solo Tableau.

  4. Per modificare il modo in cui Tableau esegue l’accesso, accanto all’opzione Join tra database, fai clic su Modifica.
  5. Nella finestra di dialogo Join tra database seleziona una delle seguenti opzioni, quindi fai clic su OK:
    • Utilizza Tableau o database esistenti. Questa opzione permette a Tableau di scegliere l’opzione più veloce per eseguire il join, sia Hyper o il database a cui sei connesso.
    • Utilizza solo Tableau Questa opzione è quella predefinita e utilizza sempre Hyper per eseguire il join.

    L’opzione Join tra database cambia dall’opzione predefinita, Utilizzo di Tableau (utilizzo di Hyper), alla nuova opzione Utilizzo del database, a seconda di ciò che si sceglie.

    Importante: se selezioni Usa Tableau o database esistenti, verrà scelta l’opzione più veloce durante l’esecuzione del join. Questo comportamento è predeterminato da un insieme di criteri, inclusi i tipi di join. Ad esempio, Tableau sceglie sempre Hyper per i join non interni.

    Se Tableau utilizza Hyper per eseguire il join, questo processo avviene in background e non viene mostrato alcun indicatore per identificare dove è stato eseguito il join.

  6. Aggiungi una o più clausole di join selezionando un campo da un’origine dati, un operatore di join e un campo dalla tabella aggiunta. Analizza la clausola del join per assicurarti che rifletta il modo in cui desideri collegare le tabelle.

Informazioni sull’utilizzo di origini dati multi-connessione

L’utilizzo di origini dati multi-connessione è uguale all’utilizzo di qualsiasi altra origine dati, con alcune precisazioni, illustrate in questa sezione.

Unione di dati all’interno di una connessione

Per unire i dati, devi utilizzare tabelle di testo o tabelle di Excel dalla stessa connessione. In altre parole, non puoi unificare tabelle provenienti da database diversi. In Tableau Desktop puoi unificare le tabelle in cartelle di lavoro e file Excel diversi in directory diverse. Per maggiori informazioni, consulta Unificare le tabelle usando la ricerca con carattere jolly (Tableau Desktop).

Se devi unire dati da database diversi, utilizza Tableau Prep(Il collegamento viene aperto in una nuova finestra).

Regole di confronto

Le regole di confronto fanno riferimento alle regole di un database che determinano la modalità di confronto e ordinamento dei valori stringa. In genere, le regole di confronto vengono gestite dal database. Tuttavia, quando lavori con join tra database, puoi creare un join di colonne con regole di confronto diverse.

Ad esempio, supponi che il join tra database utilizzi una chiave di join formata da una colonna con distinzione maiuscole/minuscole di SQL Server e da una colonna senza distinzione maiuscole/minuscole di Oracle. In casi come questo, Tableau mappa alcune regole di confronto ad altre per ridurre al minimo i valori di interpretazione.

Le regole seguenti vengono utilizzate in join tra database:

  • Se una colonna utilizza standard di confronto International Components for Unicode (ICU), Tableau utilizza le regole di confronto dell’altra colonna.
  • Se tutte le colonne utilizzano standard di confronto ICU, Tableau utilizza le regole di confronto della colonna della tabella di sinistra.
  • Se nessuna colonna utilizza standard di confronto ICU, Tableau utilizza una regola di confronto binaria. La regola di confronto binaria comporta che le impostazioni locali del database e del tipo di dati delle colonne determinino il modo in cui i valori stringa devono essere confrontati e ordinati.

Mantenere la distinzione tra maiuscole e minuscole per i dati di Excel

Se è necessario mantenere la distinzione tra maiuscole e minuscole per i dati di Excel durante l’esecuzione dei join, attiva l’opzione Conserva maiuscole/minuscole (Excel) dal menu Dati.

Quando questa opzione è selezionata, Tableau mantiene la distinzione tra maiuscole e minuscole e identifica in modo univoco i valori con caratteri minuscoli o maiuscoli anziché combinarli, fornendo un numero diverso di righe.

Ad esempio, supponi di avere un foglio di lavoro con “Casa” e un altro con “casa” e “CASA”. Per impostazione predefinita, Tableau ignora la distinzione tra maiuscole e minuscole e considera uguali tutte e tre le varianti di “casa”. Se l’opzione Mantieni carattere (Excel) è attiva, quando esegui il join delle tabelle, Tableau mantiene la distinzione tra maiuscole e minuscole. “Casa”, “casa” e “CASA” vengono trattati come valori diversi.

Nota: questa opzione è disponibile per tutte le lingue supportate da Tableau e non dipende dalle impostazioni locali del sistema operativo. Questa opzione è disponibile solo per le origini dati di Microsoft Excel.

Calcoli e origini dati multi-connessione

In un’origine dati multi-connessione puoi utilizzare solo un sottoinsieme di calcoli.

  • In Tableau Desktop: puoi utilizzare un calcolo specifico se è:
    • Supportato da tutte le connessioni nell’origine dati multi-connessione
    • Supportato da Estrazione di Tableau.
  • Nel Web authoring (Tableau Cloud e Tableau Server): puoi utilizzare un calcolo specifico se supportato da tutte le connessioni nell’origine dati multi-connessione.

Stored procedure

Le stored procedure non sono disponibili per le origini dati multi-connessione.

Eseguire il pivot dei dati provenienti da una connessione

Per eseguire il pivot dei dati, devi utilizzare colonne di testo o colonne di Excel della stessa connessione. In altre parole, non puoi includere in un pivot colonne provenienti da database diversi.

Eseguire l’estrazione dei file alla prima connessione (solo Tableau Desktop)

Quando esegui la connessione per estrarre file in un’origine dati multi-connessione, verifica che la connessione al file di estrazione (con estensione .hyper) sia la prima connessione. In questo modo vengono mantenute tutte le personalizzazioni che fanno parte dell’estrazione, come le modifiche alle proprietà predefinite, i campi calcolati, i gruppi, gli alias e così via.

Nota: se devi eseguire la connessione a più file di estrazione nell’origine dati multi-connessione, verranno mantenute solo le personalizzazioni incluse nell’estrazione nella prima connessione.

Estrazioni di origini dati multi-connessione che contengono connessioni ai dati basati su file (solo Tableau Desktop)

Se stai pubblicando un’estrazione di un’origine dati multi-connessione con dati basati su file, ad esempio Excel, selezionando l’opzione Includi file esterni viene eseguita una copia dei dati basati su file come parte dell’origine dati. In questo caso, una copia dei dati basati su file può essere scaricata e il relativo contenuto è accessibile da altri utenti. Se nei dati basati su file sono presenti informazioni sensibili che hai escluso intenzionalmente dall’estrazione, non selezionare Includi file esterni quando pubblichi l’origine dati.

Per maggiori informazioni sulla pubblicazione delle origini dati, consulta Pubblicare un’origine dati.

Informazioni sulle query e sui join tra database

Per ogni connessione, Tableau invia query indipendenti ai database nel join. I risultati vengono archiviati in una tabella temporanea, nel formato di un file di estrazione.

Importante: i join tra database possono spostare i dati tra i database. Assicurati che i database di cui esegui il join siano fonti attendibili.

Ad esempio, supponi di creare connessioni a due tabelle, dbo.listings e reviews$. Queste tabelle sono archiviate in due database diversi, SQL Server e Excel. Tableau esegue query sul database in ogni connessione in modo indipendente. Il database esegue la query e applica personalizzazioni, ad esempio filtri e calcoli, e Tableau archivia i risultati per ogni connessione in una tabella temporanea. In questo esempio FQ_Temp_1 è la tabella temporanea per la connessione a SQL Server e FQ_Temp_2 è la tabella temporanea per la connessione a Excel.

Tabella SQL Server

Tabella Excel

Quando esegui un join tra database, Tableau Desktop crea un join delle tabelle temporanee. Queste tabelle temporanee sono necessarie per Tableau per l’esecuzione di join tra database.

Una volta eseguito il join delle tabelle, viene applicato un filtro Primi N per limitare il numero di valori visualizzati nella griglia di dati alle prime 1.000 righe. Questo filtro viene applicato per mantenere la velocità di risposta della griglia di dati e le prestazioni globali della pagina Origine Dati.

Tabelle unite

Grazie per il tuo feedback.Il tuo feedback è stato inviato. Grazie!