Analisi con la seconda data in Tableau Desktop

Questa è la seconda fase dell’esercitazione e presuppone che il primo passaggio, Trovare la seconda data con Tableau Prep, sia stato completato.

Nella prima fase, abbiamo preso il nostro insieme di dati originali e gli abbiamo conferito una forma per rispondere alle seguenti domande:

  1. Quanti giorni sono trascorsi tra la prima e la seconda infrazione per ogni conducente?

  2. Confronta gli importi delle sanzioni relative alla prima e alla seconda infrazione. Esiste una relazione tra di esse?

  3. Quale conducente ha pagato di più? Chi ha pagato di meno?

  4. Quanti conducenti hanno commesso più tipi di infrazione?

  5. Qual è stato l’importo medio della sanzione per i conducenti che non hanno mai frequentato la scuola guida?

Mentre esploriamo queste domande, diventa chiaro che ci sono alcuni pro e contro alla prima struttura di dati che abbiamo creato. Torneremo in Tableau Prep Builder e faremo qualche ulteriore rimodellamento, poi vedremo come questo influisce sulla medesima analisi in Tableau Desktop. Infine, esamineremo un approccio all’analisi, esclusivamente per Tableau Desktop, utilizzando le espressioni Livello di dettaglio (LOD) con i dati originali.

L’obiettivo di questa esercitazione è presentare diversi concetti nel contesto di uno scenario di vita reale e prendere in considerazione più opzioni, stabilendo in modo non prescrittivo quale sia la migliore. Alla fine, avrai una visione completa di come la struttura dei dati influisce su calcoli e analisi, oltre ad aver acquisito maggiore familiarità con diversi aspetti di Tableau Prep e con i calcoli in Tableau Desktop.

Nota: per completare le attività di questa esercitazione, devi aver installato Tableau Prep Builder e Tableau Desktop (quest’ultimo è facoltativo) e aver scaricato i dati.

Per installare Tableau Prep e Tableau Desktop prima di continuare con questa esercitazione, consulta la Guida alla distribuzione di Tableau Desktop e Tableau Prep(Il collegamento viene aperto in una nuova finestra). Altrimenti puoi scaricare le versioni di prova gratuite di Tableau Prep(Il collegamento viene aperto in una nuova finestra) e Tableau Desktop(Il collegamento viene aperto in una nuova finestra).

L’insieme di dati è l’output ottenuto da Driver Infractions.tflx, come creato nella prima fase.

Analisi in Tableau Desktop

Ora che abbiamo configurato i nostri dati, li importeremo in Tableau Desktop. Possiamo rispondere facilmente ad alcune domande, ma altre implicano pochi (o molti) calcoli. Prova con le domande sottostanti; puoi espandere ciascuna di esse per visualizzare le informazioni di base su come procedere in caso di difficoltà.

Nota: puoi scaricare la cartella di lavoro Driver Infractions.twbx(Il collegamento viene aperto in una nuova finestra) per esaminare le soluzioni nel contesto. Ricorda che ci possono essere modi alternativi per interpretare l’analisi o approfondire le risposte.

1. Quanti giorni sono trascorsi tra la prima e la seconda infrazione per ogni conducente?
2. Confronta gli importi delle sanzioni relative alla prima e alla seconda infrazione. Esiste una relazione tra di esse?
3. Quale conducente ha pagato di più? Chi ha pagato di meno?
4. Quanti conducenti hanno commesso più tipi di infrazione?
5. Qual è stato l’importo medio della sanzione per i conducenti che non hanno mai frequentato la scuola guida?

Un passo avanti - Dati in forma pivot

Mentre i dati con cui abbiamo lavorato sono ben strutturati per rispondere a domande specifiche sulla prima e seconda infrazione, non è la struttura standard raccomandata per l’uso con Tableau Desktop. Più la nostra analisi si discosta dalle domande di base sulle date delle infrazioni, più i nostri calcoli diventano complicati per unire le informazioni rilevanti in forma utilizzabile.

Generalmente, quando i dati sono memorizzati con colonne multiple per lo stesso tipo di dati (come due colonne per la data, due colonne per l’importo della sanzione, ecc.) e le informazioni uniche sono memorizzate nel nome del campo (come ad esempio se si tratta della prima o della seconda infrazione), ciò indica che i dati devono essere trasformati tramite pivot.

L’esecuzione di un pivot multiplo in Tableau Prep Builder può gestire bene questa situazione. Possiamo lavorare dalla fine del flusso di Tableau Prep Infrazioni del conducente creato nell’esercitazione precedente Trovare la seconda data con Tableau Prep.

Suggerimento: assicurati di essere di nuovo in Tableau Prep per questi passaggi successivi.

  1. Dalla fase di pulizia finale, aggiungere un passaggio Pivot per ciascun campo duplicato. Utilizza l’icona del segno più nell’angolo superiore destro dell’area Campi trasformati tramite pivot per aggiungere altri valori pivot. Tutti gli insiemi dei campi (come l’importo della prima e della seconda sanzione) devono essere trasformati insieme in forma pivot.

    Suggerimento: per ulteriori informazioni su come trasformare tramite pivot, consulta Pulire e dare forma ai dati.

  2. Nell’area Campi trasformati tramite pivot, nella colonna Nomi Pivot1 fai doppio clic su ogni valore e rinominali 1a e 2a.

    Riquadro di configurazione di Pivot 1 in Tableau Prep che mostra i cinque pivot

I risultati possono essere riordinati eliminando le date nulle e rinominando e riordinando i campi.

  1. Aggiungi una fase di pulizia dopo il pivot. Nella colonna Data infrazione, fai clic con il tasto destro del mouse sulla barra nulla e scegli Escludere.

  2. Fai doppio clic sul nome del campo Nomi Pivot1 e rinominalo in Numero di infrazione.

  3. Trascina i campi se necessario per riordinarli come segue:

    Anteprima dei dati sottoposti a pivot e ripuliti

  1. Dai nuovi dati in forma pivot, crea un output denominato Infrazioni conducente in forma pivot e portarlo in Tableau Desktop. (Non dimenticare di eseguire il flusso dopo aver aggiunto il passaggio Output.)

Ora possiamo rivedere le nostre cinque domande con questa struttura di dati in forma pivot; puoi espandere ciascuna di esse per visualizzare le informazioni generali su come procedere in caso di difficoltà.

Nota: puoi scaricare il file completo del flusso Pivoted Driver Infractions.tflx per controllare il lavoro oppure puoi scaricare la cartella di lavoro Pivoted Driver Infractions.twbx per esaminare le soluzioni nel contesto. Ricorda che ci possono essere modi alternativi per interpretare l’analisi o approfondire le risposte.

1. Quanti giorni sono trascorsi tra la prima e la seconda infrazione per ogni conducente?
2. Confronta gli importi delle sanzioni relative alla prima e alla seconda infrazione. Esiste una relazione tra di esse?
3. Quale conducente ha pagato di più? Chi ha pagato di meno?
4. Quanti conducenti hanno commesso più tipi di infrazione?
5. Qual è stato l’importo medio della sanzione per i conducenti che non hanno mai frequentato la scuola guida?

I vantaggi dei dati in forma pivot

Potremmo attenerci alla struttura originale dei dati del tutorial se sapessimo di dover rispondere solo a domande a cui è facile rispondere con quella struttura. Tuttavia, il formato dei dati in forma pivot è più flessibile. Anche se richiede alcuni calcoli, una volta che sono in atto, l’insieme di dati risultante è adatto a rispondere a domande più ampie.

Un altro passo avanti - solo per i calcoli

E se non disponi di accesso a Tableau Prep Builder? È davvero una sfortuna se hai difficoltà con i dati originali? No, per niente!

Le espressioni LOD e di Tableau Desktop possono rispondere a tutte le nostre domande analitiche. Se ci colleghiamo al file Traffic Violations.xlsx(Il collegamento viene aperto in una nuova finestra) originale, sembra molto simile all’insieme di dati in forma pivot - solo senza il campo fondamentale di Numero infrazioni. Dobbiamo imitare il risultato dei passaggi di aggregazione tramite espressioni LOD.

Nota: puoi scaricare la cartella di lavoro LOD Driver Infractions.twbx(Il collegamento viene aperto in una nuova finestra) per esaminare le soluzioni nel contesto. Ricorda che ci possono essere modi alternativi per interpretare l’analisi o approfondire le risposte.

1. Quanti giorni sono trascorsi tra la prima e la seconda infrazione per ogni conducente?
2. Confronta gli importi delle sanzioni relative alla prima e alla seconda infrazione. Esiste una relazione tra di esse?
3. Quale conducente ha pagato di più? Chi ha pagato di meno?
4. Quanti conducenti hanno commesso più tipi di infrazione?
5. Qual è stato l’importo medio della sanzione per i conducenti che non hanno mai frequentato la scuola guida?

È importante ricordare che questa soluzione ha molti calcoli annidati ed espressioni LOD. A seconda delle dimensioni dell’insieme di dati e della complessità dei dati, le prestazioni potrebbero presentare dei problemi.

Riflessione sulle modalità

Allora, quale percorso seguire? Dipende interamente da te e dagli strumenti a tua disposizione.

  • Se si vuole stare alla larga dai LOD, c’è una soluzione di modellamento dei dati, anche se i calcoli potrebbero essere necessari per alcune analisi (Analisi in Tableau Desktop).

  • Se puoi modellare i dati e ti senti a tuo agio con i calcoli - compresi i LOD - l’opzione centrale offre la migliore flessibilità (Un passo avanti - Dati in forma pivot).

  • Se ti senti a tuo agio con i LOD, l’impatto sulle prestazioni è minimo e/o se non hai accesso a Tableau Prep, la soluzione di questo problema con i soli LOD è un’opzione praticabile (Un altro passo avanti - solo per i calcoli).

Come minimo, è importante capire come l’aggregazione in Tableau Prep e il livello delle espressioni di dettaglio in Tableau Desktop sono correlati e quale impatto hanno sull’analisi dei dati. Come per la maggior parte delle funzioni in Tableau, c’è più di un modo di farle. Esplorare tutte le varie opzioni può aiutare a riunire i concetti e a scegliere la soluzione migliore per te.

Calcoli utilizzati:

Nota: un ringraziamento speciale ad Ann Jackson per l’articolo pubblicato su Workout Wednesday Do Customers Spend More on Their First or Second Purchase?(Il collegamento viene aperto in una nuova finestra) e al suggerimento di Andy Kriebel riguardo a Tableau Prep Returning the First and Second Purchase Dates(Il collegamento viene aperto in una nuova finestra), che sono stati fonte di ispirazione per questa esercitazione. Facendo clic su questi link, uscirai dal sito Web di Tableau. Tableau non si assume alcuna responsabilità per l’accuratezza o l’aggiornamento delle pagine gestite da fornitori esterni. Contatta i proprietari se hai domande sul loro contenuto.