Suggerimenti per lavorare con i dati
I dati possono essere organizzati in diversi modi. Per trarre vantaggio da Tableau Desktop, Tableau consiglia di collegarsi ai dati formattati per l’analisi. In particolare, i dati che sono:
il più granulari possibile piuttosto che aggregati (come i dati meteorologici giornalieri piuttosto che le medie mensili)
organizzati come una tabella di database (piuttosto che una tabella a colonne, come una tabella a campi incrociati)
privati di informazioni estranee (tutto ciò che non sono i dati e le relative intestazioni)
Quando i dati sono strutturati per l’analisi, è molto più facile porre e rispondere alle domande. Tableau può aggregare i dati non elaborati al livello desiderato, piuttosto che essere limitato dalle aggregazioni già presenti nei dati. I gruppi e le gerarchie possono essere creati in base alle necessità e i calcoli possono essere eseguiti nel flusso di analisi.
Tableau Desktop dispone di opzioni di pulizia di base e di uno Interprete dei dati. Tableau Prep può essere necessario per problemi di formattazione più complessi.
Le seguenti sezioni specifiche di Tableau Desktop evidenziano e forniscono suggerimenti per risolvere alcuni problemi o formattazioni comuni che possono rendere difficile l’analisi dei dati.
Pivot dei dati in formato a campi incrociati
Quando i dati vengono formattati in formato a campi incrociati, la tabella è a colonne. In una tabella a colonne, le variabili sono memorizzate come intestazioni di colonna. Tuttavia, Tableau Desktop è ottimizzato per i dati disposti a righe. In una tabella a righe, le variabili sono archiviate nei valori delle righe.
Ad esempio, supponiamo di avere una tabella a colonne che mostra i voti di matematica, scienze e storia per gli studenti delle scuole elementari.
Tableau Desktop è ottimizzato per connettersi alle tabelle a righe, dove i valori di matematica, scienze e storia sono organizzati sotto una colonna denominata "Materia" e i voti di ogni studente sono organizzati sotto una colonna denominata "Voto". Puoi trasformare tramite pivot le colonne in righe modificando manualmente i dati di Excel. In alternativa, esegui la connessione ai dati Excel da Desktop e quindi utilizza l’opzione di rotazione. Per maggiori informazioni sull’opzione pivot, consulta Ruotare i dati da colonne a righe.
Rimuovere i dati pre-aggregati
I dati possono spesso essere pre-aggregati. Vale a dire che i dati possono contenere somme, medie, mediane, ecc. Un esempio comune di dati pre-aggregati si presenta sotto forma di subtotali e totali complessivi. I subtotali e i totali complessivi sono calcolati a partire dai dati grezzi, ma non fanno parte dei dati grezzi stessi.
Ad esempio, supponiamo di avere una tabella che contiene una riga di informazioni sui subtotali.
In questo caso, i dati pre-aggregati devono essere rimossi. Per utilizzare i subtotali e i totali complessivi nell’analisi, rimuovi manualmente questo tipo di informazioni dalla tabella. Esegui quindi la connessione ai dati Excel da Desktop e calcola i subtotali e i totali complessivi utilizzando l’opzione Totali. Per maggiori informazioni, consulta Mostra totali in una visualizzazione. In alternativa, esegui la connessione ai dati Excel da Desktop, attiva lo Interprete dei dati e quindi utilizza l’opzione Totali. Per maggiori informazioni, consulta Pulire dati importati da Excel, CSV, PDF e Fogli Google con Interprete dei dati.
Rimuovere o escludere testo introduttivo
I dati Excel forniti sotto forma di report possono contenere titoli o blocchi di testo introduttivo. Poiché Desktop prevede intestazioni di colonna o valori di riga nella prima riga di una tabella, queste informazioni possono causare problemi durante l’analisi.
Ad esempio, supponiamo di avere una tabella che contiene un titolo e una data del report.
In questo caso, il titolo e la data devono essere rimossi. Per utilizzare un titolo e una data per un report, esegui una delle seguenti operazioni:
- Rimuovi manualmente queste informazioni dai dati Excel. Esegui quindi la connessione ai dati Excel da Desktop e aggiungi un titolo del report utilizzando l’opzione Titolo. Per maggiori informazioni, consulta Formattare singole parti della vista.
- Esegui quindi la connessione ai dati Excel da Desktop, attiva lo Interprete dei dati e quindi utilizza l’opzione Titolo. Per maggiori informazioni, consulta Pulire dati importati da Excel, CSV, PDF e Fogli Google con Interprete dei dati.
- Se non è possibile rimuovere queste informazioni dai dati di Excel, crea un intervallo con nome ed esegui la connessione all’intervallo con nome da Desktop. Per maggiori informazioni, consulta Excel.
Compattare le intestazioni gerarchiche in una singola riga
In generale, Tableau Desktop prevede che solo la prima riga dei dati Excel contenga intestazioni di colonna. I dati che contengono più livelli di intestazioni di colonna possono causare problemi durante l’analisi.
Ad esempio, supponiamo di avere una tabella che contiene un’intestazione principale e più intestazioni secondarie.
In questo caso, la gerarchia delle intestazioni deve essere compattata o rimossa. A tale scopo, puoi creare manualmente una nuova colonna per ogni intestazione nella gerarchia direttamente nei dati di Excel. In alternativa, esegui la connessione ai dati Excel da Tableau Desktop e quindi attiva lo Interprete dei dati. Verifica che le intestazioni siano compattate correttamente. Per maggiori informazioni sullo Interprete dei dati, consulta Pulire dati importati da Excel, CSV, PDF e Fogli Google con Interprete dei dati.
Non creare celle vuote
Se crei nuove colonne per le intestazioni gerarchiche, fai in modo che ogni cella nelle nuove colonne contenga valori.
Potresti ripetere lo stesso valore per ogni riga, ma è comunque importante che ogni riga contenga i dati che la associano ai dati memorizzati nell’intestazione gerarchica. È necessario rimuovere manualmente le celle vuote dai dati Excel.
Rimuovere le righe vuote
Verifica che nei dati non siano presenti righe vuote. Per correggere le righe vuote, è necessario rimuovere le righe vuote dai dati Excel.
Aggiungere intestazioni mancanti
Verifica che non vi siano intestazioni di colonna mancanti. Per correggere le intestazioni mancanti, devi aggiungere manualmente le intestazioni mancanti ai dati di Excel.