Configurare l'insieme di dati

Per determinare la quantità di dati da includere nel flusso, puoi configurare l'insieme di dati. Quando ti connetti ai dati o trascini le tabelle nel riquadro Flusso, a quest'ultimo si aggiunge automaticamente una fase di Input. Questa è sempre la prima fase all'interno del flusso. Puoi fare clic con il tasto destro del mouse sulla fase di Input per rinominarla o rimuoverla. Se sei connesso a un file di testo o Excel, puoi anche aggiornare i dati dalla fase di input. Per ulteriori informazioni su come aggiornare i dati dal passaggio di input, vedi Aggiungere altri dati nella fase di input(Link opens in a new window).

Nella fase di input, puoi visualizzare i dettagli sul tuo insieme di dati. Qui è possibile cercare campi, visualizzare valori campione ed eseguire azioni per ridurre le dimensioni del set di dati, come la selezione dei campi da includere, la selezione del campione di dati con cui lavorare o l'applicazione di filtri a campi o righe selezionati. È inoltre possibile configurare le proprietà dei campi modificando il tipo di dati o il nome del campo o configurare le impostazioni del testo per i file di testo.

Nota: i valori dei campi che includono le parentesi quadre vengono automaticamente convertiti in parentesi tonde.

Connettersi a una query SQL personalizzata

Se il tuo database supporta l'uso di SQL personalizzato, verrà visualizzato SQL personalizzato nella parte inferiore del riquadro Connessioni. Fai doppio clic su SQL personalizzato per aprire la scheda SQL personalizzato, in cui è possibile inserire query per preselezionare i dati e utilizzare operazioni specifiche per le origini. Una volta che la query ha recuperato l'insieme di dati, puoi selezionare i campi da includere, applicare filtri o modificare il tipo di dati prima di aggiungere i dati al flusso.

Per ulteriori informazioni sull'utilizzo di SQL personalizzato, vedi Connettersi a una query SQL personalizzata(Link opens in a new window) in Tableau Desktop e nella Guida all'authoring Web.

Applicare operazioni di pulizia in una fase di input

Solo alcune operazioni di pulizia sono disponibili in una fase di input. Puoi effettuare una qualsiasi delle seguenti modifiche nell'elenco dei campi di input. Le modifiche vengono monitorate nel riquadro Modifiche e le annotazioni appaiono a sinistra della fase di input nel riquadro Flusso e nell'elenco dei campi di input.

  • Filtro: fai clic su Filtra valori nella barra degli strumenti, quindi inserisci i criteri del filtro nell'editor di calcolo.

  • Rinomina campo: nel campo Nome campo, fai doppio clic (o clic tenendo premuto il tasto Ctrl su Mac) sul nome del campo e inseriscine uno nuovo.

  • Cambia tipo di dati: fai clic sul tipo di dati per il campo e seleziona un nuovo tipo di dati dal menu.

  • Rimuovi campo: deseleziona la casella di controllo accanto ai campi che non vuoi includere nel flusso.

Selezionare i campi da includere nel flusso

Il riquadro Input ti mostra un elenco di campi del tuo insieme di dati. Puoi utilizzare il campo Cerca per trovare i campi nell'elenco, quindi utilizzare le caselle di controllo per selezionare i campi da includere o escludere. Per includere o escludere dal flusso tutti i campi, seleziona la casella di controllo in alto a sinistra della griglia.

Applicare filtri ai campi nella fase di Input

Per filtrare un campo, procedi come segue:

  1. Nella barra degli strumenti fai clic su Filtra valori.

  2. Inserisci i tuoi criteri di filtro nell'editor di calcolo.

Il tipo di filtro di calcolo è l'unica opzione di filtro disponibile nella fase di input. Altre opzioni di filtro sono disponibili in altri tipi di fasi. Per ulteriori informazioni, vedi Filtrare i dati(Link opens in a new window).

Modificare i nomi dei campi

Per modificare il nome di un campo, seleziona il nome nella colonna Nome del campo, quindi digita il nuovo nome nel campo. Nella griglia di campo e nel riquadro di flusso a sinistra della fase di Input viene aggiunta un'annotazione. Le modifiche vengono tracciate anche nel riquadro Modifiche.

Modificare i tipi di dati

Per modificare il tipo di dati di un campo, esegui i seguenti passaggi:

  1. Fai clic sul tipo di dati del campo.

  2. Seleziona il nuovo tipo di dati dal menu.

    Puoi inoltre modificare il tipo di dati per i campi in altri tipi di fasi nel flusso o assegnare ruoli di dati per aiutare a convalidare i valori dei campi. Per ulteriori informazioni sulla modifica del tipo di dati o sull'utilizzo dei ruoli dati, vedi Rivedi i tipi di dati assegnati ai tuoi dati(Link opens in a new window) e Utilizzare i ruoli dati per convalidare i dati(Link opens in a new window).

Configurare le proprietà del campo

Quando lavori con i file di testo, viene visualizzata la scheda Impostazioni del testo, in cui puoi modificare la connessione e configurare le proprietà del testo, come il separatore di campo per i file di testo. Nel riquadro Connessioni è inoltre possibile modificare la connessione del file.

Quando lavori con file di testo o Excel, puoi correggere i tipi di dati che sono stati estrapolati in modo errato prima ancora di iniziare il flusso. I tipi di dati possono sempre essere modificati nelle fasi successive nel riquadro Profilo dopo aver avviato il flusso.

Configurare le impostazioni del testo nei file di testo

Per modificare le impostazioni utilizzate per analizzare i file di testo, seleziona una delle seguenti opzioni:

  • La prima riga contiene l'intestazione (predefinita): seleziona questa opzione per utilizzare la prima riga come etichetta del campo.

  • Genera nomi campo automaticamente: seleziona questa opzione se desideri che Tableau Prep Builder generi automaticamente le intestazioni dei campi. La convenzione di denominazione dei campi segue lo stesso modello di Tableau Desktop. Ad esempio F1, F2 e così via.

  • Separatore di campo: seleziona un carattere dall'elenco da utilizzare per separare le colonne. Seleziona Altro per inserire un carattere personalizzato.

  • Qualificatore di testo: seleziona il carattere che racchiude i valori del file.

  • Insieme di caratteri: seleziona l'insieme di caratteri che descrive la codifica del file di testo.

  • Impostazioni locali: seleziona la directory da utilizzare per l'analisi dei file. Questa impostazione indica il separatore di decimali e migliaia da utilizzare.

Impostare la dimensione del campione di dati

Tableau Prep Builder limita i dati inclusi nel flusso a campione rappresentativo del set di dati allo scopo di mantenere prestazioni ottimali. Il campione di dati viene determinato calcolando il numero ottimale di righe in base al numero totale di campi nell'insieme di dati e ai tipi di dati per tali campi. Tableau Prep Builder recupera quindi il numero di righe superiore per l'importo calcolato, il più rapidamente possibile.

Il campione di dati risultante può includere o meno tutte le righe necessarie, a seconda di come il campione è stato calcolato e restituito. Se non vedi i dati che avevi previsto, puoi modificare le impostazioni del campione di dati per eseguire nuovamente la query.

Nota: se i dati vengono campionati, nel riquadro Profilo viene visualizzato un indicatore Campionato, che persiste per ogni fase che viene aggiunta. Qualsiasi modifica apportata si applica al campione con cui si sta lavorando nel flusso. Quando esegui il flusso, tutte le modifiche si applicano all'intero insieme di dati.

Per modificare le impostazioni del campione di dati, seleziona una fase di Input, quindi nella scheda Campione di dati seleziona una delle seguenti opzioni:

  • Quantità di esempio predefinita (valore predefinito): Tableau Prep Builder calcola il numero totale di righe da restituire.

  • Usa tutti i dati: recupera tutte le righe del tuo insieme di dati, indipendentemente dalle dimensioni. Questa azione può influire sulle prestazioni o causare un time out di Tableau Prep Builder.

    Nota: per preservare le prestazioni, anche se selezioni questa impostazione, ai tipi di fasi Aggrega e Unione viene applicato un limite di campionamento dati di 1 milione di righe, mentre ai tipi di fasi Join e Pivot viene applicato un limite di campionamento dati di 3 milioni di righe.

  • Numero fisso di righe: seleziona il numero di righe da restituire dall'insieme di dati. Il numero di righe consigliato è di 1 milione o inferiore. Impostare un numero di righe superiore a un milione può influire sulle prestazioni.

  • Selezione rapida (impostazione predefinita): il database restituisce il numero di righe richiesto nel minor tempo possibile. Questo potrebbe essere il primo numero N di righe o le righe che il database aveva memorizzato da una query precedente.

  • Campione casuale: il database restituisce il numero di righe richieste ma passa in rassegna ogni riga dell'insieme di dati e restituisce un campione rappresentativo di tutte le righe. Questa opzione può influire sulle prestazioni quando i dati vengono recuperati per la prima volta.

Grazie per il tuo feedback. Si è verificato un errore durante l'invio del feedback. Riprova o scrivici.