Connettersi ai dati

Per utilizzare Tableau Prep Builder per pulire e preparare i dati, avvia un nuovo flusso connettendoti ai dati, come in Tableau Desktop. Puoi anche aprire un flusso esistente e riprendere da dove avevi interrotto.

Hai la possibilità di visualizzare e accedere ai tuoi flussi più recenti direttamente dalla pagina iniziale, così da trovare i file in lavorazione senza difficoltà. Dopo esserti connesso ai dati, utilizza le diverse opzioni nella fase di Input per identificare i dati con cui desideri lavorare nel flusso. Aggiungi quindi un passaggio di pulizia o un altro tipo di passaggio per esaminare, pulire e modellare i dati.

Avviare o aprire un flusso

Tableau Prep Builder supporta le connessioni ai tipi di dati più diffusi e alle estrazione dati Tableau (.tde o .hyper). Nella versione 2019.3.1 e successive, è anche possibile connettersi alle origini dati pubblicate.

Nella versione 2020.2.2 e successive, oltre alle origini dati pubblicate, è possibile cercare e connettersi a database, file e tabelle archiviati in Tableau Server o Tableau Online se è abilitato il componente aggiuntivo Data Management(Link opens in a new window) con Tableau Catalog. Per maggiori informazioni su Tableau Catalog, consulta "Informazioni su Tableau Catalog" nella Guida di Tableau Server(Link opens in a new window) o Tableau Online(Link opens in a new window).

I connettori supportati in Tableau Desktop potrebbero non essere ancora supportati nella versione di Tableau Prep Builder. A ogni nuova versione vengono aggiunti nuovi connettori, controlla quindi il riquadro Connessioni per vedere se il tuo connettore è disponibile.

Nota: se si apre un flusso in una versione in cui il connettore non è supportato, il flusso potrebbe aprirsi ma presentare errori o non funzionare a meno che le connessioni dati non vengano rimosse.

È inoltre possibile utilizzare query SQL personalizzate per connettersi ai dati proprio come avviene in Tableau Desktop. Per ulteriori informazioni, vedi Connettersi a una query SQL personalizzata(Link opens in a new window) in Tableau Desktop e nella Guida alla creazione Web.

Per verificare che sia possibile connetterti ai tuoi dati, apri Tableau Prep Builder e fai clic sul pulsante Aggiungi connessione per verificare se nel riquadro di sinistra in Connetti è elencato un connettore per i tuoi dati.

Per consentire la connessione ai dati, alcuni connettori potrebbero richiedere il download e l'installazione di un driver. Vai alla pagina Download dei driver(Link opens in a new window) sul sito Web di Tableau per ottenere i link di download dei driver e le istruzioni di installazione.

A partire dalla versione 2020.1.1, puoi anche vedere facilmente quali connettori e tabelle sono associati ai passaggi di input. Quando fai clic sul passaggio di input, il connettore e la tabella di dati associati vengono evidenziati nel riquadro Connessioni.

Avviare un nuovo flusso

  1. Apri Tableau Prep Builder e fai clic sul pulsante Aggiungi connessione .

  2. Dall'elenco dei connettori, seleziona il tipo di file o il server che ospita i tuoi dati. Se ti viene richiesto, inserisci le informazioni necessarie per accedere ai dati.

  3. Dal riquadro Connessioni, esegui una delle seguenti operazioni:

    • Se ti sei connesso a un file, fai doppio clic o trascina una tabella nel riquadro Flusso per avviare il flusso. Per le singole tabelle, Tableau Prep Builder crea automaticamente una fase di input nel riquadro Flusso quando aggiungi dati al flusso.

    • Se ti sei connesso a un database, seleziona un database o uno schema e fai doppio clic o trascina una tabella nel riquadro Flusso per avviarlo.

      Nota: se ti connetti a più file o tabelle di database da una singola origine dati, puoi utilizzare una ricerca con caratteri jolly e unire i file o le tabelle nella fase di input. Per ulteriori informazioni, consulta Unificare file e tabelle di database nella fase di input(Link opens in a new window).

Aprire un flusso esistente

Per aprire un flusso esistente, vai alla Pagina iniziale ed esegui una delle seguenti operazioni:

  • Seleziona un flusso in Flussi recenti.

  • Fai clic su Apri un flusso per andare al file di flusso e aprirlo.

Fai clic su File > Nuovo oppure su File > Apri per aprire una nuova area di lavoro. Se desideri lavorare su più flussi contemporaneamente, puoi aprire più aree di lavoro di Tableau Prep Builder utilizzando queste opzioni. In Tableau Prep Builder versione 2019.3.1 e precedenti, se selezioni File > Apri, Tableau Prep Builder sostituisce il flusso attualmente aperto con il nuovo flusso selezionato.

Connettersi a origini dati pubblicate (versione 2019.3.1 e successive)

Se pubblichi origini dati su Tableau Server o Tableau Online da Tableau Desktop o come output dal flusso, puoi connetterti a queste origini dati pubblicate e utilizzarle come origini dati di input per il flusso.

Nota: quando pubblichi un flusso che include un'origine dati pubblicata come input, il Publisher viene assegnato come proprietario predefinito del flusso. Quando il flusso è in esecuzione, utilizza il proprietario del flusso per l'account Esegui come. Per ulteriori informazioni sull'account Esegui come, consulta Account di servizio Esegui come(Link opens in a new window). Solo l'amministratore del sito o del server può cambiare il proprietario del flusso in Tableau Server o Tableau Online.

Per l'utilizzo di questa funzione si applicano i seguenti requisiti:

  • La connessione alle origini dati pubblicate disponibili in Tableau Server versione 2019.3 e successive è pienamente supportata. Se ti connetti a origini dati pubblicate da una versione precedente di Tableau Server, è possibile che non tutte le funzioni siano disponibili.
  • Per eseguire la connessione alle origini dati pubblicate, devi avere il ruolo di Explorer o superiore nel sito di Tableau Server a cui hai effettuato l'accesso. Per ulteriori informazioni sui ruoli del sito, consulta Impostare i ruoli del sito dell'utente(Link opens in a new window) nella Guida di Tableau Server.
  • Le credenziali devono essere incorporate per connettersi all'origine dati pubblicata. Se le credenziali non sono incorporate per l'origine dati, aggiorna l'origine dati in modo da includere le credenziali incorporate.
  • Le origini dati pubblicate che includono dati multidimensionali (cubi) o che includono filtri utente non sono attualmente supportate.
  • Le connessioni a più server non sono supportate. È necessario utilizzare la stessa connessione al server o al sito per eseguire le seguenti operazioni:
    • Connettersi all'origine dati pubblicata.
    • Pubblicare l'output del flusso su Tableau Server o Tableau Online.
    • Pianificare il flusso da eseguire su Tableau Server o Tableau Online.

Per connettersi a un'origine dati pubblicata, segui le istruzioni per la versione di Tableau Prep Builder in uso:

Versione 2020.2.1 e precedenti
  1. Apri Tableau Prep Builder e fai clic sul pulsante Aggiungi connessione .

  2. Dall'elenco dei connettori, seleziona Tableau Server.

  3. Accedi per connetterti al tuo server o sito.

  4. Seleziona l'origine dati o utilizza l'opzione di ricerca per trovarla, quindi trascinala nel riquadro di flusso per avviare il flusso. La scheda Tableau Server nel riquadro Input mostra i dettagli sull'origine dati pubblicata.

Versione 2020.2.2 e successive

Puoi connetterti alle origini dati pubblicate e ad altre risorse archiviate in Tableau Server o Tableau Online direttamente dal riquadro Connetti. Se il componente aggiuntivo Data Management(Link opens in a new window) con Tableau Catalog è abilitato, puoi anche cercare e connetterti a database e tabelle e visualizzare o filtrare i metadati relativi alle origini dati, ad esempio descrizioni, avvisi sulla qualità dei dati e certificazioni.

Per maggiori informazioni su Tableau Catalog, consulta "Informazioni su Tableau Catalog" nella Guida di Tableau Server(Link opens in a new window) o Tableau Online(Link opens in a new window).

  1. Apri Tableau Prep Builder e fai clic sul pulsante Aggiungi connessione .
  2. Nel riquadro Connetti, in Ricerca dati, seleziona Tableau Server.

  3. Accedi per connetterti al tuo server o sito.

  4. Nella finestra di dialogo Ricerca dati esegui una ricerca da un elenco di origini dati pubblicate disponibili. Utilizza l'opzione di filtro per applicare filtri in base al tipo di connessione e alle origini dati certificate.

  5. Seleziona l'origine dati da utilizzare, quindi fai clic su Connetti.

    Se non disponi dell'autorizzazione per connetterti a un'origine dati, la riga e il pulsante Connetti sono disattivati.

    Nota: l'elenco a discesa Tipo di contenuto non viene visualizzato se il componente aggiuntivo Data Management con Tableau Catalog non è abilitato. Nell'elenco vengono visualizzate solo le origini dati pubblicate.

  6. L'origine dati viene aggiunta al riquadro di flusso. Nel riquadro Connessione puoi selezionare origini dati aggiuntive o utilizzare l'opzione di ricerca per trovare un'origine dati, quindi trascinarla nel riquadro di flusso per avviare il flusso. La scheda Tableau Server nel riquadro Input mostra i dettagli sull'origine dati pubblicata.

  7. (Facoltativo) Se il componente aggiuntivo Data Management con Tableau Catalog è abilitato, utilizza l'elenco a discesa Tipo di contenuto per cercare database e tabelle.

    Puoi utilizzare l'opzione di filtro nell'angolo superiore destro per filtrare i risultati in base al tipo di connessione, agli avvisi sulla qualità dei dati e alle certificazioni.

Connettersi a origini dati cloud

Puoi connetterti a origini dati cloud di Tableau Prep Builder proprio come in Tableau Desktop, ma se prevedi di pubblicare flussi che si connettono a origini dati cloud e di eseguirli in base a una pianificazione nel server, sarà necessario configurare le credenziali in Tableau Server o Tableau Online.

Puoi impostare le credenziali nella scheda Impostazioni della pagina Impostazioni account e connetterti all'input del connettore cloud tramite le stesse credenziali. Durante la pubblicazione del flusso, nella finestra di dialogo Pubblica, fai clic su Modifica per modificare la connessione, quindi nel menu a discesa Autenticazione seleziona Incorpora <credenziali>.

A partire dalla versione 2020.1.1, puoi aggiungere le credenziali direttamente dalla finestra di dialogo di pubblicazione al momento della pubblicazione del flusso e quindi incorporarle automaticamente nel flusso al momento della pubblicazione. Per ulteriori informazioni, vedi Pubblicare un flusso.

Se non hai salvato le credenziali impostate e selezioni Avvisa utente nel menu a discesa Autenticazione, dopo aver pubblicato il flusso devi modificare la connessione e inserire le credenziali nella scheda Connessioni in Tableau Server. In caso contrario, verranno generati errori di Tableau Online o del flusso durante l'esecuzione.

In Tableau Prep Builder versione 2019.4.1 sono stati aggiunti i seguenti connettori cloud:

  • Box
  • DropBox
  • Google Drive
  • OneDrive

Per maggiori informazioni su come collegarti ai dati tramite questi connettori, vedi l'argomento relativo allo specifico connettore(Link opens in a new window) nella Guida di Tableau Desktop.

Connettersi a dati di Salesforce (versione 2020.2.1 e successive)

Tableau Prep Builder supporta la connessione ai dati tramite il connettore Salesforce, proprio come Tableau Desktop ma con alcune differenze.

  • Tableau Prep Builder supporta qualsiasi tipo di join che desideri eseguire.
  • Il codice SOQL personalizzato attualmente non è supportato.
  • L'utilizzo di una connessione standard per creare una connessione personalizzata attualmente non è supportato.
  • Non puoi modificare il nome dell'origine dati predefinita in modo da renderlo univoco o personalizzato.
  • Se prevedi di pubblicare flussi in Tableau Server e desideri utilizzare le credenziali salvate, l'amministratore del server dovrà configurare Tableau Server con un ID client OAuth e un segreto nel connettore. Per maggiori informazioni, consulta Modificare Salesforce.com OAuth per l'utilizzo di credenziali salvate(Link opens in a new window) nella Guida di Tableau Server.

Tableau Prep Builder importa i dati creando un'estrazione. Solo le estrazioni sono attualmente supportate per Salesforce. L'estrazione iniziale può richiedere un certo tempo, a seconda della quantità di dati inclusi. Durante il caricamento dei dati, verrà visualizzato un timer nel passaggio di input.

Per informazioni generali sull'utilizzo del connettore Salesforce, consulta Salesforce(Link opens in a new window) nella Guida di Tableau Desktop e Web Authoring.

Connettersi a Google BigQuery (versione 2019.3.1 e successive)

Tableau Prep Builder supporta la connessione ai dati utilizzando Google BigQuery, proprio come Tableau Desktop. È necessario configurare le credenziali OAuth per far sì che Tableau Prep Builder possa comunicare con Google BigQuery. Se prevedi di pubblicare i flussi su Tableau Server o Tableau Online, le connessioni OAuth devono essere configurate anche per queste applicazioni.

Nota: Tableau Prep Builder attualmente non supporta l'utilizzo degli attributi di personalizzazione di Google BigQuery.

Se utilizzi Tableau Prep Builder su Mac e usi un proxy per connetterti a Big Query, devi modificare la configurazione SSL per connetterti a Google BigQuery

Configurare SSL per la connessione a Google BigQuery (solo MacOS)

Nota: non sono richiesti passaggi aggiuntivi per gli utenti Windows.

Per configurare SSL per le connessioni OAuth a Google BigQuery, completa i seguenti passaggi:

  1. Esporta il certificato SSL per il proxy in un file, ad esempio proxy.cer. Puoi trovare il certificato in Applications > Utilities > Keychain Access >System > Certificates (under Category).
  2. Determina la versione di Java che stai utilizzando per eseguire Tableau Prep Builder. Ad esempio: /Applications/Tableau Prep Builder 2020.1.app/Plugins/jre/lib/security/cacerts

  3. Apri il prompt dei comandi del terminale ed esegui il seguente comando per la tua versione di Tableau Prep Builder:

    Nota: il comando keytool deve essere eseguito dalla directory che contiene la versione di Java che stai utilizzando per eseguire Tableau Prep Builder. Potrebbe essere necessario cambiare directory prima di eseguire questo comando. Ad esempio, cd /Users/tableau_user/Desktop/SSL.cer -keystore Tableau Prep Builder 2020.1.1/Plugins/jre/bin. Esegui quindi il comando keytool.

    keytool –import –trustcacerts –file /Users/tableau_user/Desktop/SSL.cer -keystore Tableau Prep Builder <version>/Plugins/jre/lib/security/cacerts -storepass changeit

    Esempio: keytool –import –trustcacerts –file /Users/tableau_user/Desktop/SSL.cer -keystore Tableau Prep Builder 2020.1.1/Plugins/jre/lib/security/cacerts -storepass changeit

Se viene generata un'eccezione FileNotFoundException (Accesso negato) durante l'esecuzione del comando keytool, prova a eseguire il comando con autorizzazioni elevate. Ad esempio: sudo keytool –import –trustcacerts –file /Users/tableau_user/Desktop/SSL.cer -keystore Tableau Prep Builder 2020.1.1/Plugins/jre/lib/security/cacerts -storepass changeit.

Impostare e gestire le credenziali di Google BigQuery

Le credenziali che usi per connetterti a Google BigQuery nella fase di input devono corrispondere alle credenziali impostate nella scheda Impostazioni della pagina Impostazioni del mio account per Google BigQuery in Tableau Server o Tableau Online.

Se selezioni delle credenziali diverse o non selezioni alcuna credenziale nelle impostazioni di autenticazione durante la pubblicazione del flusso, quest'ultimo non verrà eseguito correttamente e causerà un problema di autenticazione fino a quando non modificherai la connessione per il flusso in Tableau Server o Tableau Online.

Per modificare le credenziali, procedi come segue:

  1. In Tableau Server o Tableau Online, dalla scheda Connessioni, sulla connessione di Google BigQuery fai clic su Altre azioni.
  2. Seleziona Modifica connessione.
  3. Seleziona le credenziali salvate e impostate nella scheda Impostazioni della pagina Impostazioni del mio account.

Per maggiori informazioni sull'impostazione e la gestione delle credenziali, vedi i seguenti argomenti:

Gestire le impostazioni dell'account(Link opens in a new window) nella Guida di Tableau Desktop e Web Authoring.

Pubblicare un flusso(Link opens in a new window) per informazioni sull'impostazione delle opzioni di autenticazione durante la pubblicazione di un flusso.

Visualizzare e risolvere gli errori per informazioni sulla risoluzione degli errori di connessione in Tableau Server o Tableau Online.

Connettersi a SAP HANA (versione 2019.2.1 e successive)

Tableau Prep Builder supporta la connessione ai dati tramite SAP HANA proprio come Tableau Desktop ma con alcune differenze. Connettiti al database utilizzando la stessa procedura che utilizzeresti in Tableau Desktop. Per maggiori informazioni, consulta SAP HANA(Link opens in a new window). Dopo aver eseguito la connessione e la ricerca della tabella, trascina la tabella nell'area di disegno per iniziare a creare il flusso.

La richiesta di variabili e parametri durante l'apertura di un flusso non è supportata in Tableau Prep Builder. Nel riquadro Input, fai clic sulla scheda Variabili e parametri e seleziona le variabili e gli operandi che desideri utilizzare, quindi seleziona un elenco di valori predefiniti o immetti valori personalizzati per eseguire query sul database e restituire i valori desiderati.

Nota: a partire da Tableau Prep Builder versione 2019.2.2 puoi utilizzare SQL iniziale per eseguire una query della connessione e, se disponi di più valori per una variabile, puoi selezionare il valore necessario da un elenco a discesa.

È inoltre possibile aggiungere ulteriori variabili. Fai clic sul pulsante nella sezione Variabili e seleziona una variabile e un operando, quindi immetti un valore personalizzato.

Nota: questo connettore non è supportato in Tableau Prep Conductor versione 2019.1. Se crei un flusso che utilizza questo connettore, puoi pubblicare il flusso ma non sarà possibile eseguire il flusso utilizzando le funzionalità di pianificazione disponibili in Tableau Server. Puoi eseguire il flusso utilizzando l'interfaccia della riga di comando per mantenere i dati aggiornati. Per ulteriori informazioni su come eseguire i flussi dalla riga di comando, consulta Aggiornare i file di output del flusso dalla riga di comando(Link opens in a new window). Per maggiori informazioni sulla compatibilità tra le versioni, consulta Compatibilità versione con Tableau Prep(Link opens in a new window).

Connettersi utilizzando ODBC (versione 2019.2.2 e successive)

Se è necessario connettersi a origini dati che non sono elencate nel riquadro Connessioni, puoi connetterti a qualsiasi origine dati utilizzando il connettore Altri database (ODBC) che supporta lo standard SQL e implementa l'API ODBC. La connessione ai dati utilizzando il connettore Altri database (ODBC) funziona in modo simile a come lo potresti usare in Tableau Desktop, ma ci sono alcune differenze:

  • Puoi connetterti solo utilizzando l'opzione DSN (nome dell'origine dati).

  • Per pubblicare ed eseguire il flusso in Tableau Server, il server deve essere configurato utilizzando un DSN corrispondente.

    Nota: l'esecuzione di flussi dalla riga di comando (Tableau Prep Builder) che includono il connettore Altri database (ODBC) non è attualmente supportata.

  • Esiste un'unica esperienza di connessione sia per Windows sia per macOS. La richiesta di attributi di connessione per i driver ODBC (Windows) non è supportata.

  • Solo i driver a 64 bit sono supportati da Tableau Prep Builder.

Prima della connessione

Per connettersi ai dati utilizzando il connettore Altri database (ODBC), devi installare il driver del database e impostare e configurare il DSN (nome dell'origine dati). Per pubblicare ed eseguire i flussi su Tableau Server, il server deve essere anche configurato con un DSN corrispondente.

Importante: Tableau Prep Builder supporta solo driver a 64 bit. Se disponi di un driver a 32 bit già impostato e configurato, potrebbe essere necessario disinstallarlo e quindi installare la versione a 64 bit se il driver non consente di installare entrambe le versioni contemporaneamente.

  1. Creare un DSN utilizzando Amministrazione origine dati ODBC (64 bit) per Windows o l'utility ODBC Manager per macOS.

    Se sul tuo Mac non è presente l'utility installata, puoi scaricarne una da (www.odbcmanager.net(Link opens in a new window) ad esempio) oppure puoi modificare manualmente il file odbc.ini.

  2. In amministrazione origine dati ODBC (64 bit) per Windows o nell'utility ODBC Manager per macOS, aggiungi una nuova origine dati, seleziona il driver per l'origine dati e fai clic su Fine.

  3. Nella finestra di dialogo Installazione driver ODBC, immetti le informazioni di configurazione come il nome del server, la porta, il nome utente e la password. Fai clic su Verifica (se la finestra di dialogo dispone di tale opzione) per verificare che la connessione sia impostata correttamente, quindi salva la configurazione.

    Nota: Tableau Prep Builder non supporta la richiesta di attributi di connessione, quindi è necessario impostare queste informazioni durante la configurazione del DNS.

    Questo esempio mostra la finestra di dialogo di configurazione di MySQL Connector.

Connessione utilizzando Altri database (ODBC)

  1. Apri Tableau Prep Builder e fai clic sul pulsante Aggiungi connessione.

  2. Dall'elenco dei connettori, seleziona Altri database (ODBC).

  3. Nella finestra di dialogo Altri database (ODBC), seleziona un DSN dall'elenco a discesa e inserisci il nome utente e la password. Quindi, fai clic su Accedi.

  4. Dal riquadro Connessioni, seleziona il database dall'elenco a discesa.

Utilizzare il comando SQL iniziale per eseguire query sulle connessioni (versione 2019.2.2 e successive)

Puoi specificare un comando SQL iniziale che verrà eseguito quando viene effettuata una connessione al database che lo supporta. Ad esempio, quando ti connetti ad Amazon Redshift, puoi inserire un'istruzione SQL per applicare un filtro quando ci si connette al database, proprio come aggiungere filtri nella fase di input. Il comando SQL verrà applicato prima che i dati vengano campionati e caricati in Tableau Prep Builder.

A partire dalla versione 2020.1.3, puoi anche includere parametri per passare i dati relativi al nome dell'applicazione, alla versione e al nome del flusso, in modo da includere dati di monitoraggio quando esegui query sull'origine dati.

Eseguire il comando SQL iniziale

Per aggiornare i dati ed eseguire il comando SQL iniziale, effettua una delle seguenti operazioni:

•Modifica il comando SQL iniziale e aggiorna il passaggio di input ristabilendo la connessione.

• Esegui il flusso. Il comando SQL iniziale viene eseguito prima di elaborare tutti i dati.

•Pianifica il flusso da eseguire su Tableau Server o Tableau Online. Il comando SQL iniziale viene eseguito ogni volta che viene eseguito il flusso, come parte dell'esperienza di caricamento dei dati.

Nota: il componente aggiuntivo Data Management(Link opens in a new window) è necessario per eseguire il flusso su Tableau Server o Tableau Online. Per maggiori informazioni su Componente aggiuntivo per la gestione dei dati, consulta Usare il componente aggiuntivo Data Management(Link opens in a new window).

  1. Nel riquadro Connessioni, seleziona un connettore nell'elenco che supporta il comando SQL iniziale.
  2. Fai clic sul collegamento Mostra SQL iniziale per espandere la finestra di dialogo e inserire le istruzioni SQL.

Includere i parametri nell'istruzione SQL iniziale (versione 2020.1.3 e successive)

Importante: i parametri non sono supportati per il comando SQL iniziale in Tableau Prep Builder versione 2020.2.1 e precedenti. Se provi a inserire i parametri come faresti in Tableau Desktop, riceverai degli errori.

Puoi passare i seguenti parametri all'origine dati per aggiungere ulteriori dettagli sull'applicazione Tableau Prep, la versione e il nome del flusso. I parametri TableauServerUser e TableauServerUserFull non sono attualmente supportati.

Parametro Descrizione Valore restituito
TableauApp L'applicazione utilizzata per accedere all'origine dati.

Prep Builder

Prep Conductor

TableauVersion Il numero di versione dell'applicazione.

Tableau Prep Builder: restituisce la versione esatta. Ad esempio, 2020.1.3

Tableau Prep Conductor: restituisce la versione principale del server in cui è abilitato Tableau Prep Conductor. Ad esempio, 2020.1

FlowName Il nome del file .tfl in Tableau Prep Builder Ad esempio, Dati intrattenimento_Puliti

Connettersi alle estrazioni dei dati di Tableau

Quando ti connetti a un estratto dati di Tableau, Tableau Prep Builder scompone l'estratto e si iper espande, utilizzando un'ingente quantità di spazio temporaneo mentre applica le operazioni di flusso ai dati grezzi risultanti.

Questo significa che per ospitare un file di quelle dimensioni potrebbe servire più spazio su RAM e su disco. Ad esempio, un file di estrazione con 18 colonne e 1,2 milioni di righe da 360 MB (8,5 GB non compressi) può richiedere fino a 32 GB di RAM, 16 core e 500 GB di spazio su disco disponibile per supportare il file decompresso.

Utilizzare Interprete dati per pulire i file

Lavorando con i file Microsoft Excel, puoi utilizzare Interprete dati per rilevare le sotto-tabelle nei dati e rimuovere le informazioni estranee, preparando così i dati per l'analisi. Quando Interprete dati viene attivato, rileva queste sotto-tabelle e le elenca come nuove tabelle nella sezione Tabelle del riquadro Connessioni.

A questo punto puoi trascinarle nel riquadro Flusso. Se utilizzi Tableau Prep Builder versione 2018.1.2 o successive, puoi selezionare l'opzione Unione caratteri jolly nella scheda File multipli per includere tutti le sotto-schede rilevate nel flusso. Per ulteriori informazioni sull'utilizzo dell'unione di caratteri jolly nella fase di input, consulta Unificare file e tabelle di database nella fase di input(Link opens in a new window).

Se disattivi lo strumento di interpretazione dei dati, queste tabelle vengono rimosse dal riquadro Connessioni. Se queste tabelle sono già utilizzate nel flusso, si verificheranno errori di flusso dovuti ai dati mancanti.

Nota: attualmente, Interprete dati rileva solo le sotto-tabelle nei fogli di calcolo Excel e non supporta la riga iniziale per i file di testo e i fogli di calcolo.

L'esempio seguente mostra i risultati dell'utilizzo dello strumento di interpretazione dei dati su un foglio di calcolo Excel nel riquadro Connessioni. Interprete dati ha rilevato due ulteriori sotto-tabelle.

Prima di Interprete dati Dopo Interprete dati

Per utilizzare Interprete dati, completa i seguenti passaggi:

  1. Seleziona Connetti ai dati, quindi seleziona Microsoft Excel.

  2. Seleziona il file e fai clic su Apri.

  3. Seleziona la casella di controllo Utilizza Interprete dati.

  4. Trascina la nuova tabella nel riquadro Flusso per includerla nel tuo flusso. Per rimuovere la vecchia tabella, fai clic con il tasto destro del mouse sulla sua fase di Input e seleziona Rimuovi.

Altri articoli in questa sezione

Grazie per il tuo feedback. Si è verificato un errore durante l'invio del feedback. Riprova o scrivici.