Pulire dati importati da Excel, CSV, PDF e Fogli Google con Interprete dei dati
Quando raccogli dati in un foglio di calcolo Excel, lo fai avendo in mente l’interfaccia umana. Per facilitare la lettura dei fogli di calcolo, puoi includere elementi come titoli, un sacco di intestazioni, note, magari righe e colonne vuote per aggiungere spazio bianco, e probabilmente avrai anche più schede dati.
Quando vuoi analizzare questi dati in Tableau, tutti questi attributi esteticamente piacevoli rendono molto difficile per Tableau interpretare i dati. È qui che può esserti utile Interprete dei dati.
Suggerimento: anche se il componente aggiuntivo di Tableau per Excel non è più supportato, Interprete dei dati può aiutarti a rimodellare i dati per l’analisi in Tableau.
Cosa fa Interprete dei dati
Interprete dei dati può darti un grande aiuto quando pulisci i dati. Può rilevare elementi quali titoli, note, piè di pagina, celle vuote, ecc. e bypassarli per identificare i campi e i valori effettivi nel tuo insieme di dati.
Può inoltre rilevare ulteriori tabelle e sottotabelle in modo da consentirti di lavorare con un sottoinsieme di dati indipendentemente dagli altri dati.
Dopo che Interprete dei dati ha fatto la sua magia, puoi controllare il suo lavoro per assicurarti che abbia catturato i dati che volevi e li abbia identificati correttamente. Poi, puoi apportare le modifiche necessarie.
Dopo aver selezionato i dati da utilizzare, potresti aver bisogno di eseguire alcune operazioni di pulizia aggiuntive, come la rotazione dei dati, la divisione dei campi o l’aggiunta di filtri per ottenere i dati nella forma desiderata prima di iniziare l’analisi.
Nota: se i dati necessitano di una pulizia ulteriore rispetto a quella che ti può offrire Interprete dei dati, prova Tableau Prep(Il collegamento viene aperto in una nuova finestra).
Attiva Interprete dei dati e controlla i risultati
Dal riquadro Connetti, collegati a un foglio di calcolo Excel o a un altro connettore che supporti Interprete dei dati, come file di testo con estensione .csv, file PDF o Fogli Google.
Trascina una tabella nel canvas (se necessario), quindi nella pagina Origine dati, nel riquadro di sinistra, seleziona la casella di controllo Usa Interprete dei dati per verificare se Interprete dei dati può aiutarti a ripulire i dati.
Nota: quando ripulisci i dati con Interprete dei dati, il programma ripulisce tutti i dati associati a un collegamento nell’origine dati. Interprete dei dati non modifica i dati sottostanti.
Nel riquadro Dati, fai clic sul link Esamina i risultati per verificare i risultati di Interprete dei dati.
Una copia dell’origine dati viene aperta in Excel nella scheda Chiave per Interprete dei dati. Controlla la chiave per scoprire come leggere i risultati.
Fai clic su ogni scheda per esaminare come Interprete dei dati ha interpretato l’origine dati.
Se Interprete dei dati trova tabelle aggiuntive, chiamate anche tabelle o sottotabelle trovate, esse vengono identificate nella scheda <nome foglio>_subtables delineando i loro intervalli di celle. Viene inoltre inclusa una scheda separata per ogni sottotabella, codificata a colori per identificare l’intestazione e le righe di dati.
Se Interprete dei dati non fornisce i risultati previsti, deseleziona la casella di controllo Pulito con Interprete dei dati per utilizzare l’origine dati originale.
Per sostituire la tabella corrente con una qualsiasi delle tabelle trovate, trascina la tabella corrente fuori dal canvas e quindi sposta sul canvas la tabella trovata che desideri utilizzare.
Se Interprete dei dati ha erroneamente identificato l’intervallo della tabella trovata, dopo che hai trascinato la tabella trovata sul canvas, fai clic sulla freccia a discesa su quella tabella e poi seleziona Modifica tabella trovata per regolare gli angoli della tabella trovata (la cella in alto a sinistra e la cella in basso a destra della tabella).
Dopo aver ottenuto i dati sui quali vuoi lavorare, puoi applicare ai dati eventuali operazioni di pulizia aggiuntive in modo da poterli analizzare.
Esempio di utilizzo di Interprete dei dati
In questo esempio ci collegheremo ad un foglio di calcolo Excel con i dati sulla criminalità violenta per città e stato per l’anno 2016. Questo foglio di calcolo include tabelle multiple su un unico foglio e qualche ulteriore elemento di formattazione.
Titolo
Celle di intestazione unite
Spazio bianco aggiuntivo
Sottotabelle
La particolare formattazione di questo foglio di calcolo rende difficile per Tableau determinare quali sono le intestazioni di campo e i valori.
Invece, legge i dati verticalmente e assegna ad ogni colonna il valore di default F1, F2, F3 (Campo 1, Campo 2, Campo 3) e così via. Le celle vuote vengono lette come valori NULL.
Per vedere se Interprete dei dati può aiutare a pulire questo set di dati, selezioniamo Usa Interprete dei dati.
Interprete dei dati ha rilevato le intestazioni corrette per i campi, rimosso la formattazione extra e trovato diverse sottotabelle. Le sottotabelle sono elencate nella sezione Fogli del riquadro Dati e sono denominate utilizzando il nome del foglio originale e gli intervalli di celle per ogni sottotabella.
In questo esempio sono presenti tre sottotabelle: Crimini 2016 A4:H84, Crimini 2016 K5:L40 e Crimini 2016 O5:P56.
Per esaminare più da vicino i risultati di Interprete dei dati, facciamo clic sul link Verifica i risultati nel riquadro Dati per visualizzare una copia del foglio di calcolo con le note.
Qui vediamo una copia dei dati originali, codificati a colori per identificare quali dati sono stati identificati come dati di intestazione e quali dati sono stati identificati come valori di campo.
La scheda successiva ci mostra le sottotabelle che ha trovato Interprete dei dati, delineate dagli intervalli di celle.
In questo esempio la prima sottotabella, Crimini 2016 A4:H84, contiene i dati principali con cui vogliamo lavorare. Per utilizzare questa tabella come tabella dati, possiamo semplicemente trascinare la tabella originale fuori dal canvas e poi trascinare la nuova tabella sul canvas.
Una volta che abbiamo sul canvas i dati con cui vogliamo lavorare, possiamo ripulire ulteriormente i dati. Ad esempio, possiamo:
Modificare i nomi dei campi in modo che rappresentino nomi di città, stati e mesi.
Ruotare i campi dei mesi.
Trascinare all’interno la terza sottotabella Crimini 2016 O5:P56 e unirla alla nostra prima sottotabella nel campo dello Stato per includere le popolazioni dello Stato per la nostra analisi.
Nascondere eventuali campi duplicati aggiunti a seguito del join.
I risultati potrebbero presentarsi in questo modo:
Ora siamo pronti per iniziare ad analizzare i nostri dati in Tableau.
Se Interprete dei dati non è disponibile
L’opzione Interprete dei dati potrebbe non essere disponibile per i seguenti motivi:
L’origine dati è già in un formato che Tableau può interpretare: se Tableau Desktop non ha bisogno di ulteriore aiuto da parte di Interprete dei dati per gestire una formattazione univoca o informazioni estranee, l’opzione Interprete dei dati non è disponibile.
Molte righe o molte colonne: l’opzione Interprete dei dati non è disponibile quando i dati hanno i seguenti attributi:
I dati contengono più di 2000 colonne.
I dati contengono più di 3000 righe e più di 150 colonne.
L’origine dati non è supportata: Interprete dei dati è disponibile solo per i file di Microsoft Excel, per file di testo con estensione .csv, file PDF e Fogli Google. Per Excel, i dati devono essere nel formato .xls o .xlsx.