Salvare e condividere il lavoro

In qualsiasi punto del flusso, è possibile salvare il flusso, visualizzare un'anteprima dei dati del flusso in Tableau Desktop o creare un'estrazione dei dati che include tutte le operazioni applicate al flusso. A partire dalla versione 2020.3.1, puoi anche scrivere i dati del flusso in database selezionati per condividere i dati preparati puliti. Puoi anche creare pacchetti dei dati con il flusso per condividerli con altre persone o pubblicare l'estrazione dei dati su Tableau Server o Tableau Online come origine dati.

Per mantenere aggiornati i dati, puoi eseguire i singoli flussi in Tableau Prep Builder o dalla riga di comando. Per eseguire automaticamente i flussi in base a una pianificazione, puoi pubblicarli su Tableau Server o Tableau Online. Per ulteriori informazioni sui flussi in esecuzione, consulta Aggiornare i file di output del flusso dalla riga di comando(Link opens in a new window) o Pubblicare un flusso in Tableau Server o Tableau Online(Link opens in a new window).

Salva un flusso

Salva il flusso per eseguire il backup del tuo lavoro prima di eseguire qualsiasi operazione aggiuntiva. Il tuo flusso viene salvato nel formato file di flusso Tableau Prep Builder (.tfl).

È inoltre possibile creare pacchetti dei file locali (Excel, file di testo ed estrazioni di Tableau) con il flusso per condividerli con altre persone, proprio come creare il pacchetto di una cartella di lavoro da condividere in Tableau Desktop. Solo i file locali possono essere impacchettati con un flusso. I dati delle connessioni al database, ad esempio, non sono inclusi.

Quando si salva un flusso incluso nel pacchetto, il flusso viene salvato come file di flusso incluso nel pacchetto di Tableau (.tflx).

  • Per salvare il flusso, dal menu in alto seleziona File > Salva.

  • Per creare un pacchetto dei file di dati con il flusso, dal menu in alto, esegui una delle seguenti operazioni:

    • Seleziona File > Esporta flusso incluso nel pacchetto

    • Seleziona File > Salva con nome. Quindi, nella finestra di dialogo Salva con nome, seleziona File di flusso di Tableau incluso nel pacchetto dal menu a discesa Salva con nome.

Ripristino automatico dei file (versione 2020.3.3 e successive)

Per impostazione predefinita, Tableau Prep Builder salva automaticamente una bozza di tutti i flussi aperti se l'applicazione si blocca o si arresta in modo anomalo. Le bozze di flussi vengono salvate nella cartella Recovered Flows in My Tableau Prep Repository. Alla successiva apertura dell'applicazione, viene visualizzata una finestra di dialogo con un elenco dei flussi ripristinati tra cui scegliere. È possibile aprire un flusso ripristinato e continuare dal punto in cui il lavoro si è interrotto oppure eliminare il file di flusso ripristinato se non è necessario.

Nota: se sono presenti flussi ripristinati nella cartella Recovered Flows, questa finestra di dialogo viene visualizzata ogni volta che si apre l'applicazione fino a quando tale cartella non è vuota.

Se non desideri che questa funzionalità sia abilitata, in qualità di amministratore, puoi disattivarla durante o dopo l'installazione. Per maggiori informazioni su come configurare questa funzionalità, consulta Disattivare il ripristino dei file(Link opens in a new window) nella Guida alla distribuzione di Tableau Desktop e Tableau Prep.

Visualizza il tuo campione di dati in Tableau

A volte, durante la pulizia dei dati, potrebbe essere necessario controllare i propri progressi visualizzandoli in Tableau Desktop. Quando il flusso si apre in Tableau Desktop, Tableau Prep Builder crea un estratto permanente Tableau (.tde o .hyper a seconda della versione di Tableau) e un file origine dati di Tableau (.tds). I file vengono salvati nel repository di Tableau nel file Origini dati in modo da poter sperimentare con i dati in qualsiasi momento.

Nota: sebbene sia possibile sperimentare i dati, Tableau mostra solo un esempio dei dati e non sarà possibile salvare la cartella di lavoro come cartella di lavoro compressa (.twbx). Quando sei pronto per lavorare con i dati in Tableau, crea una fase di output per il flusso e salva l'output in un file o come origine dati pubblicata, quindi connettiti all'origine dati completa in Tableau.

Quando si apre il flusso in Tableau Desktop, è possibile visualizzare il campione di dati con cui si sta lavorando nel flusso con le operazioni ad esso applicate, fino al passaggio selezionato.

Per visualizzare il tuo campione di dati in Tableau Desktop, effettua le seguenti operazioni:

  1. Fai clic con il pulsante destro del mouse sul passaggio in cui desideri visualizzare i dati e seleziona Anteprima in Tableau Desktop dal menu contestuale.

  2. Tableau Desktop si apre nella scheda Foglio.

Crea e pubblica estrazioni e origini dati

Importante: a partire dalla versione 2020.3.1 di Tableau Prep Builder, i file Estrazione dati Tableau (.tde) non sono più supportati per l'output del flusso. Tutti i flussi pubblicati in un server versione 2020.3 e successive che inviano l'output a questo tipo di file devono essere convertiti in modo da inviare l'output al tipo di file Estrazione Hyper (.hyper). In caso contrario, il flusso non verrà eseguito. Se il flusso è pubblicato in Tableau Server o Tableau Online, scarica il flusso, modifica il tipo di output e ripubblica il flusso per evitare errori di esecuzione del flusso.

Per creare un'estrazione, esegui il flusso. Quando si esegue il flusso, le modifiche vengono applicate all'intero insieme di dati. L'esecuzione del flusso produce un file Origine dati Tableau (.tds) e un file Estrazione dati Tableau (.hyper). È possibile creare un file di estrazione dall'output del flusso da utilizzare in Tableau Desktop o per condividere i dati con terzi.

A partire dalla versione 2020.2.1, puoi eseguire il flusso utilizzando l'aggiornamento incrementale. Questa opzione permette di risparmiare tempo e risorse, consentendo di aggiornare solo i nuovi dati anziché l'insieme di dati completo. Per informazioni su come configurare ed eseguire il flusso utilizzando l'aggiornamento incrementale, consulta Aggiornare i dati del flusso tramite l'aggiornamento incrementale.

Nota: è possibile pubblicare estrazioni o origini dati su Tableau Server versione 10.0 e successive e su Tableau Online.

È possibile creare un file di estrazione nei seguenti formati:

  • Estrazione Hyper (.hyper): questo è il più recente tipo di file di estrazione di Tableau e può essere utilizzato solo da Tableau Desktop o da Tableau Server versione 10.5 e successive.

  • Valore separato da virgola (.csv): salva l'estrazione in un file .csv per condividere i dati con terze parti. La codifica del file CSV esportato sarà UTF-8 con BOM.

Puoi anche pubblicare il tuo output come origine dati su Tableau Server o Tableau Online per condividere i dati e fornire accesso centralizzato ai dati che hai pulito, a cui hai dato forma e che hai combinato. A partire dalla versione 2020.3.1, è possibile salvare l'output del flusso in un database per creare, sostituire o aggiungere i dati delle tabelle con i dati del flusso puliti e preparati. Per maggiori informazioni, consulta Salvare i dati di output del flusso in database esterni (versione 2020.3.1 e successive).

Nota: per pubblicare l'output su Tableau Server, è necessario abilitare l'API REST di Tableau Server. Per ulteriori informazioni, consulta Requisiti di API REST(Link opens in a new window) nella Guida di API REST di Tableau. Per effettuare la pubblicazione su un server che utilizza certificati di crittografia SSL (Secure Socket Layer), sono necessarie ulteriori fasi di configurazione sul computer che esegue Tableau Prep Builder. Per ulteriori informazioni, consulta i Prima dell'installazione(Link opens in a new window) nella Guida alla distribuzione di Tableau Desktop e Tableau Prep Builder.

Crea un file di estrazione

  1. Fai clic sull'icona del simbolo più in un passaggio e seleziona Aggiungi output.

    Se hai eseguito il flusso in precedenza, fai clic sul pulsante di esecuzione del flusso nel passaggio di output. Verrà eseguito il flusso e aggiornato l'output.

    Il riquadro Output si apre e mostra un'istantanea dei dati.

  2. Nel riquadro sinistro seleziona File dell'elenco a discesa Salva output in (seleziona Salva su file nelle versioni precedenti).

  3. Fai clic sul pulsante Sfoglia, quindi nella finestra di dialogo Salva estrazione con nome immetti un nome per il file e fai clic su Accetta.

  4. Nel campo Tipo di output, seleziona uno dei seguenti tipi di output:

    • Estrazione dati Tableau (.hyper)

    • Valori separati da virgola (.csv)

  5. (versione 2020.2.1 e successive) Nella sezione Opzioni di scrittura, visualizza l'opzione di scrittura predefinita per la scrittura dei nuovi dati nei file e apporta le modifiche necessarie. Per maggiori informazioni, consulta Configurare le opzioni di scrittura.

    • Crea tabella: questa opzione consente di creare una nuova tabella o di sostituire la tabella esistente con il nuovo output.

    • Aggiungi alla tabella: questa opzione aggiunge i nuovi dati alla tabella esistente. Se la tabella non esiste già, viene creata una nuova tabella e le esecuzioni successive aggiungeranno nuove righe a questa tabella.

      Nota: l'opzione Aggiungi alla tabella non è supportata per i tipi di output .csv. Per maggiori informazioni sulle combinazioni di aggiornamento supportate, consulta Opzioni di aggiornamento del flusso.

  6. Fai clic su Esegui flusso per eseguire il flusso e generare il file di estrazione.

Pubblica come origine dati

  1. Fai clic sull'icona del simbolo più in un passaggio e seleziona Aggiungi output.

    Se hai eseguito il flusso in precedenza, fai clic sul pulsante di esecuzione del flusso nel passaggio di output. Verrà eseguito il flusso e aggiornato l'output.

    Nota: nella versione 2020.1.1, Tableau Prep Builder aggiornerà le origini dati precedentemente pubblicate e manterrà qualsiasi modellazione dei dati (ad esempio, campi calcolati, formattazione dei numeri e così via) eventualmente inclusa nell'origine dati. Se l'origine dati non può essere aggiornata, sarà sostituita.

  2. Il riquadro Output si apre e mostra un'istantanea dei dati.

  3. Dall'elenco a discesa Salva output in seleziona Origine dati pubblicata (seleziona Pubblica come origine dati nelle versioni precedenti) e completa i seguenti campi:

    • Server: seleziona il server in cui desideri pubblicare l'origine dati e l'estrazione dati. Se non hai effettuato l'accesso a un server, ti verrà richiesto di effettuare l'accesso.

      Nota: a partire dalla versione 2020.1.4 di Tableau Prep Builder, dopo l'accesso al server, Tableau Prep Builder memorizza il nome del server e le credenziali alla chiusura dell'applicazione. Alla successiva apertura dell'applicazione, viene già effettuato l'accesso al server.

      Su Mac è possibile che ti venga richiesto di fornire l'accesso al Portachiavi del Mac, in modo che Tableau Prep Builder possa utilizzare in sicurezza i certificati SSL per connettersi al tuo ambiente Tableau Server o Tableau Online.

      Se stai inviando l'output a Tableau Online, includi in "serverUrl" il pod sul quale il tuo sito è ospitato. Ad esempio, "https://eu-west-1a.online.tableau.com" e non "https://online.tableau.com".

    • Progetto: seleziona il progetto dove desideri caricare l'origine dati e l'estrazione dei dati.

    • Nome: immetti il nome di un file.

    • Descrizione: immetti una descrizione per l'origine dati.

  4. (versione 2020.2.1 e successive) Nella sezione Opzioni di scrittura, visualizza l'opzione di scrittura predefinita per la scrittura dei nuovi dati nei file e apporta le modifiche necessarie. Per maggiori informazioni, consulta Configurare le opzioni di scrittura

    • Crea tabella: questa opzione consente di creare una nuova tabella o di sostituire la tabella esistente con il nuovo output.

    • Aggiungi alla tabella: questa opzione aggiunge i nuovi dati alla tabella esistente. Se la tabella non esiste già, viene creata una nuova tabella e le esecuzioni successive aggiungeranno nuove righe a questa tabella.

  5. Fai clic su Esegui flusso per eseguire il flusso e pubblicare l'estrazione di dati.

Salvare i dati di output del flusso in database esterni (versione 2020.3.1 e successive)

Importante: questa funzionalità consente di eliminare e sostituire definitivamente i dati in un database esterno. Assicurati di disporre delle autorizzazioni per la scrittura nel database.
Per evitare perdite di dati, è possibile utilizzare l'opzione SQL personalizzato per creare una copia dei dati della tabella ed eseguirla prima di scrivere i dati del flusso nella tabella.

Puoi connetterti ai dati da qualsiasi connettore supportato da Tableau Prep Builder e inviare l'output dei dati a un database esterno. In questo modo è possibile aggiungere o aggiornare i dati nel database con i dati puliti e preparati dal flusso ogni volta che viene eseguito il flusso. Questa funzionalità è disponibile sia per le opzioni di aggiornamento incrementale che per le opzioni di aggiornamento completo. Per maggiori informazioni su come configurare l'aggiornamento incrementale, consulta Aggiornare i dati del flusso tramite l'aggiornamento incrementale.

Quando salvi l'output del flusso in un database esterno, Tableau Prep Builderesegue le operazioni seguenti:

  1. Genera le righe ed esegue tutti i comandi SQL sul database.
  2. Scrive i dati in una tabella temporanea (o nell'area di gestione temporanea se si invia l'output in Snowflake) nel database di output.
  3. Se l'operazione ha esito positivo, i dati vengono spostati dalla tabella temporanea (o dall'area di gestione temporanea per Snowflake) nella tabella di destinazione.
  4. Esegue gli eventuali comandi SQL da eseguire dopo la scrittura dei dati nel database.

Se lo script SQL ha esito negativo, anche il flusso avrà esito negativo. I dati verranno comunque caricati nelle tabelle del database. Puoi provare a eseguire nuovamente il flusso o eseguire manualmente lo script SQL sul database per applicarlo.

Opzioni di output

Puoi selezionare le opzioni seguenti durante la scrittura dei dati in un database. Se la tabella non esiste già, viene creata alla prima esecuzione del flusso.

  • Aggiungi alla tabella: questa opzione aggiunge i dati a una tabella esistente. Se la tabella non esiste, viene creata alla prima esecuzione del flusso e i dati vengono aggiunti a tale tabella a ogni esecuzione del flusso successiva.
  • Crea tabella: questa opzione crea una nuova tabella con i dati del flusso. Se la tabella esiste già, la tabella e qualsiasi struttura di dati o proprietà esistenti definite per la tabella vengono eliminate e sostituite con una nuova tabella che utilizza la struttura dei dati del flusso. Tutti i campi presenti nel flusso vengono aggiunti alla nuova tabella del database.
  • Sostituisci dati: questa opzione elimina i dati nella tabella esistente e li sostituisce con i dati nel flusso, ma mantiene la struttura e le proprietà della tabella del database. Se la tabella non esiste, viene creata alla prima esecuzione del flusso e i dati della tabella vengono sostituiti a ogni esecuzione del flusso successiva.

Opzioni aggiuntive

Oltre alle opzioni di scrittura, puoi anche includere script SQL personalizzati o aggiungere nuove tabelle al database.

  • Script SQL personalizzati: immetti il codice SQL personalizzato e scegli se eseguire lo script prima, dopo o sia prima che dopo la scrittura dei dati nelle tabelle del database. Puoi utilizzare questi script per creare una copia della tabella del database prima che i dati del flusso vengano scritti nella tabella, aggiungere un indice, aggiungere altre proprietà della tabella e così via.
  • Aggiunta di una nuova tabella: aggiungi al database una nuova tabella con un nome univoco anziché selezionarne una dall'elenco delle tabelle esistenti. Se desideri applicare uno schema diverso da quello predefinito (Microsoft SQL Server e PostgreSQL), puoi specificarlo utilizzando la sintassi [schema name].[table name]. Per includere le parentesi quadre nel nome della tabella, raddoppia la parentesi quadra di apertura e triplica la parentesi quadra di chiusura. Ad esempio, [[nomi tabella]]]."

Database supportati e requisiti dei database

Tableau Prep Builder supporta la scrittura dei dati del flusso nelle tabelle di un numero selezionato di database. I flussi eseguiti in base a una pianificazione in Tableau Online possono eseguire la scrittura in questi database solo se sono ospitati nel cloud.

Alcuni database presentano restrizioni o requisiti per i dati. Tableau Prep Builder può inoltre imporre alcuni limiti per mantenere prestazioni ottimali durante la scrittura dei dati nei database supportati. Nella tabella seguente sono elencati i database in cui è possibile salvare i dati del flusso e le eventuali restrizioni o i requisiti dei database. I dati che non soddisfano questi requisiti possono causare errori durante l'esecuzione del flusso.

Nota: Tableau Prep Builder non supporta ancora l'impostazione di limiti di caratteri per i campi. È tuttavia possibile creare nel database le tabelle che includono vincoli per il limite di caratteri, quindi utilizzare l'opzione Sostituisci datiper sostituire i dati ma mantenere la struttura della tabella nel database.

Database Requisiti o restrizioni
Amazon Redshift
  • Le regole di confronto non sono supportate. I nomi dei campi vengono convertiti in lettere minuscole.
  • È possibile scrivere fino a 8192 caratteri per i valori dei campi di testo. I valori più lunghi verranno troncati.
Microsoft SQL Server
  • È possibile scrivere fino a 3072 caratteri per i valori dei campi di testo. I valori più lunghi verranno troncati.

MySQL
  • È possibile scrivere fino a 8192 caratteri per i valori dei campi di testo. I valori più lunghi verranno troncati.
Oracle
  • I nomi dei campi e delle tabelle non possono superare i 30 caratteri.
  • È possibile scrivere fino a 1000 caratteri per i valori dei campi di testo. I valori più lunghi verranno troncati.
  • I caratteri speciali nei nomi dei campi possono causare errori.
PostgreSQL
  • È possibile scrivere fino a 8192 caratteri per i valori dei campi di testo. I valori più lunghi verranno troncati.
Snowflake
  • È possibile scrivere fino a 8192 caratteri per i valori dei campi di testo. I valori più lunghi verranno troncati.
  • Le opzioni del warehouse devono essere impostate per la ripresa automatica in modo da consentire a Tableau Prep di scrivere i dati nel warehouse del database. Per maggiori informazioni, consulta Auto-suspension and Auto-resumption(Link opens in a new window) nella documentazione di Snowflake.

Teradata
  • È possibile scrivere fino a 1000 caratteri per i valori dei campi di testo. I valori più lunghi verranno troncati.

Salvare i dati del flusso in un database

  1. Fai clic sull'icona del segno più in un passaggio e seleziona Aggiungi output.
  2. Nell'elenco a discesa Salva output in seleziona Tabella di database.
  3. Nella scheda Impostazioni immetti le seguenti informazioni:
    • Nell'elenco a discesa Connessione seleziona il connettore di database in cui scrivere l'output del flusso. Vengono visualizzati solo i connettori supportati. Può trattarsi dello stesso connettore utilizzato per l'input del flusso o di un connettore diverso. Se selezioni un connettore diverso, ti verrà richiesto di accedere.

      Importante: assicurati di disporre dell'autorizzazione di scrittura per il database selezionato. In caso contrario, il flusso potrebbe elaborare solo parzialmente i dati.

    • Nell'elenco a discesa Database seleziona il database in cui salvare i dati di output del flusso.
    • Nell'elenco a discesa Tabella seleziona la tabella in cui salvare i dati di output del flusso. A seconda dell'opzione di scrittura selezionata, verrà creata una nuova tabella, i dati del flusso sostituiranno i dati esistenti nella tabella o i dati del flusso verranno aggiunti alla tabella esistente.

      Per creare una nuova tabella nel database, immetti un nome di tabella univoco nel campo, quindi fai clic su Crea nuova tabella. Quando esegui il flusso per la prima volta, indipendentemente dall'opzione di scrittura selezionata, la tabella viene creata nel database utilizzando lo stesso schema del flusso.

  4. Il riquadro Output mostra un'istantanea dei dati. Un confronto tra i campi mostra i campi del flusso che corrispondono ai campi della tabella, se la tabella esiste già. Se la tabella è nuova, viene visualizzata una corrispondenza dei campi uno-a-uno.

    Se sono presenti campi non corrispondenti, una nota sullo stato mostra gli eventuali errori.

    • Nessuna corrispondenza: Il campo è stato ignorato: i campi sono presenti nel flusso ma non nel database. Il campo non verrà aggiunto alla tabella del database a meno che non selezioni l'opzione di scrittura Crea tabella e non esegui un aggiornamento completo. In tal caso, i campi del flusso vengono aggiunti alla tabella del database e utilizzano lo schema di output del flusso.
    • Nessuna corrispondenza: Il campo conterrà valori NULL: i campi sono presenti nel database ma non nel flusso. Il flusso passa un valore NULL alla tabella del database per il campo. Se il campo è presente nel flusso, ma non corrisponde perché il nome del campo è diverso, puoi passare a una fase di pulizia e modificare il nome del campo in modo che corrisponda al nome del campo del database. Per informazioni su come modificare il nome del campo, consulta Applicare operazioni di pulizia.
    • Errore: i tipi di dati dei campi non corrispondono: il tipo di dati assegnato a un campo sia nel flusso che nella tabella del database in cui viene scritto l'output deve corrispondere. In caso contrario, il flusso non verrà eseguito. Puoi passare a una fase di pulizia e modificare il tipo di dati del campo per risolvere il problema. Per maggiori informazioni sulla modifica dei tipi di dati, consulta Rivedi i tipi di dati assegnati ai tuoi dati.
  5. Seleziona un'opzione di scrittura. Puoi selezionare un'opzione diversa per l'aggiornamento completo e incrementale. L'opzione viene applicata quando selezioni il metodo di esecuzione del flusso. Per maggiori informazioni sull'esecuzione del flusso mediante l'aggiornamento incrementale, consulta Aggiornare i dati del flusso tramite l'aggiornamento incrementale.
    • Aggiungi alla tabella: questa opzione aggiunge i dati a una tabella esistente. Se la tabella non esiste, viene creata alla prima esecuzione del flusso e i dati vengono aggiunti a tale tabella a ogni esecuzione del flusso successiva.
    • Crea tabella: questa opzione crea una nuova tabella. Se la tabella con lo stesso nome esiste già, la tabella esistente viene eliminata e sostituita con la nuova tabella. Qualsiasi struttura di dati o proprietà esistente definita per la tabella viene eliminata e sostituita con la struttura di dati del flusso. Tutti i campi presenti nel flusso vengono aggiunti alla nuova tabella del database.
    • Sostituisci dati: questa opzione elimina i dati nella tabella esistente e li sostituisce con i dati nel flusso, ma mantiene la struttura e le proprietà della tabella del database.
  6. (facoltativo) Fai clic sulla scheda SQL personalizzato e immetti lo script SQL. Puoi immettere uno script da eseguire Prima e Dopo la scrittura dei dati nella tabella.

  7. Fai clic su Esegui flusso per eseguire il flusso e scrivere i dati nel database selezionato.

 

Altri articoli in questa sezione

Grazie per il tuo feedback. Si è verificato un errore durante l'invio del feedback. Riprova o scrivici.