Analyse met de tweede datum in Tableau Desktop

Dit is de tweede fase van de zelfstudie en deze gaat ervan uit dat de eerste fase, De tweede datum zoeken met Tableau Prep, is voltooid.

In de eerste fase hebben we onze originele dataset aangepast om de volgende vragen te beantwoorden:

  1. Hoeveel dagen zaten er tussen de eerste en de tweede overtreding voor elke bestuurder?

  2. Vergelijk de boetebedragen voor de eerste en tweede overtreding. Zijn ze gecorreleerd?

  3. Welke chauffeur betaalde in totaal het meest? Wie betaalde het minst?

  4. Hoeveel bestuurders begingen meerdere soorten overtredingen?

  5. Wat was het gemiddelde boetebedrag voor bestuurders die nooit een verkeerscursus hadden gevolgd?

Nu we deze vragen verder onderzoeken, wordt het duidelijk dat de eerste datastructuur die we hebben gecreëerd, zowel voor- als nadelen heeft. We gaan terug naar Tableau Prep Builder en voeren nog wat aanpassingen door. Vervolgens bekijken we welke impact dat heeft op dezelfde analyse in Tableau Desktop. Tot slot bekijken we aanpak met alleen Tableau Desktop voor de analyse met behulp van Level of Detail (LOD)-expressies met de oorspronkelijke data.

Het doel van deze zelfstudie is om verschillende concepten te presenteren in de context van een realistisch scenario en de opties te bespreken. Het doel is niet om voor te schrijven welke het beste is. Aan het einde van de cursus hebt u meer inzicht in de impact die een datastructuur op berekeningen en analyses heeft. Ook bent u beter bekend met verschillende aspecten van Tableau Prep en berekeningen in Tableau Desktop.

Opmerking: om de taken in deze zelfstudies te voltooien hebt u een installatie van Tableau Prep en eventueel Tableau Desktop nodig.

Zie voor het installeren van Tableau Prep en Tableau Desktop de Implementatiegids voor Tableau Desktop en Tableau Prep(Link wordt in een nieuw venster geopend). U kunt ook gratis proefversies van Tableau Prep(Link wordt in een nieuw venster geopend) en Tableau Desktop(Link wordt in een nieuw venster geopend) downloaden.

De dataset is de uitvoer van Bestuurdersovertredingen.tflx, zoals opgezet in de eerste fase.

Analyse in Tableau Desktop

Nu we onze data hebben geconfigureerd, importeren we deze in Tableau Desktop. Sommige vragen kunnen we eenvoudig beantwoorden, maar andere vergen een paar (of veel) berekeningen. Probeer de onderstaande vragen eens uit. U kunt ze uitbreiden met basisinformatie over wat u moet doen als u ergens vastloopt.

Opmerking: u kunt de werkmap Bestuurdersovertredingen.twbx(Link wordt in een nieuw venster geopend) downloaden om de oplossingen in context te bekijken. Houd er rekening mee dat er mogelijk alternatieve manieren zijn om de analyse te interpreteren of antwoorden te vinden.

1. Hoeveel dagen zaten er tussen de eerste en de tweede overtreding voor elke bestuurder?
2. Vergelijk de boetebedragen voor de eerste en tweede overtreding. Zijn ze gecorreleerd?
3. Welke chauffeur betaalde in totaal het meest? Wie betaalde het minst?
4. Hoeveel bestuurders begingen meerdere soorten overtredingen?
5. Wat was het gemiddelde boetebedrag voor bestuurders die nooit een verkeerscursus hadden gevolgd?

Nog een stap verder - gedraaide data

Hoewel de data waarmee we hebben gewerkt, goed gestructureerd zijn om met name vragen over eerste en tweede overtredingen te beantwoorden, is het niet de standaardstructuur die wordt aanbevolen voor gebruik met Tableau Desktop. Hoe meer onze analyses verwijderd raken van de basisvragen rondom de data van overtredingen, hoe ingewikkelder het wordt om met onze berekeningen de relevante informatie te combineren tot een bruikbare vorm.

Wanneer data worden opgeslagen met meerdere kolommen voor hetzelfde type data (bijvoorbeeld twee kolommen voor de datum, twee kolommen voor het boetebedrag, enz.) en unieke informatie in de veldnaam wordt opgeslagen (bijvoorbeeld of het de eerste of tweede overtreding betreft), is dit doorgaans een indicatie dat de data moeten worden gedraaid.

U kunt dit prima doen door een meervoudige draaiing in Tableau Prep Builder uit te voeren. We kunnen starten vanaf het einde van de in Tableau Prep-flow gemaakte Bestuurdersovertreding in de vorige zelfstudie De tweede datum zoeken met Tableau Prep.

Tip: zorg ervoor dat u weer in Tableau Prep bent voor de volgende stappen.

  1. Voeg in de laatste opschoningsstap een Draaistap toe die om elk dubbel veld draait. Gebruik het pluspictogram in de rechterbovenhoek van de het gebied Gedraaide velden om meer Draaipuntwaarden toe te voegen. Elke set velden (zoals het eerste en tweede boetebedrag) moet gezamenlijk worden gedraaid.

    Zie Data opschonen en vormgeven voor meer informatie over draaien.

  2. In het gebied Gedraaide velden, onder de kolom Draai1-namen, dubbelklikt u op elke waarde en wijzigt u de naam in eerste en tweede.

    Draai1-configuratievenster in Tableau Prep met de vijf draaipunten

U kunt de resultaten opschonen door lege datums te verwijderen en door de velden een andere naam en volgorde te geven.

  1. Voeg na het draaien een opschoningsstap toe. Klik in de kolom Datum van de overtreding met de rechtermuisknop op de nulbalk en kies Uitsluiten.

  2. Dubbelklik op de veldnaam Draaipunt1-namen en wijzig de naam in Overtredingsnummer.

  3. Versleep de velden naar wens om ze opnieuw te ordenen, zoals hieronder:

    Voorbeeld van de gedraaide en opgeschoonde data

  1. Maak vanuit de nieuwe, gedraaide data een uitvoer met de naam Gedraaide bestuurdersovertredingen en kopieer deze naar Tableau Desktop. (Vergeet niet de flow uit te voeren nadat u de stap Uitvoer hebt toegevoegd.)

Nu kunnen we met deze aangepaste datastructuur opnieuw naar onze vijf vragen kijken. U kunt elke vraag uitbreiden met basisinformatie over wat u moet doen als u vastloopt.

Opmerking: u kunt het voltooide flowbestand Gedraaide bestuurdersovertredingen.tflx downloaden om uw werk te controleren, of de werkmap Gedraaide bestuurdersovertredingen.twbx downloaden om de oplossingen in context te bekijken. Houd er rekening mee dat er mogelijk alternatieve manieren zijn om de analyse te interpreteren of antwoorden te vinden.

1. Hoeveel dagen zaten er tussen de eerste en de tweede overtreding voor elke bestuurder?
2. Vergelijk de boetebedragen voor de eerste en tweede overtreding. Zijn ze gecorreleerd?
3. Welke chauffeur betaalde in totaal het meest? Wie betaalde het minst?
4. Hoeveel bestuurders begingen meerdere soorten overtredingen?
5. Wat was het gemiddelde boetebedrag voor bestuurders die nooit een verkeerscursus hadden gevolgd?

De voordelen van gedraaide data

We kunnen de originele datastructuur uit de zelfstudie aanhouden als we weten dat we alleen maar vragen hoeven te beantwoorden die met deze structuur eenvoudig te beantwoorden zijn. Maar de gedraaide data-indeling is flexibeler. Er zijn wel wat berekeningen nodig, maar als die eenmaal zijn uitgevoerd, is de resulterende dataset zeer geschikt om bredere vragen te beantwoorden.

Nog een extra stap verder - alleen berekeningen

En als u geen toegang hebt tot Tableau Prep Builder? Hebt u gewoon pech als u nog steeds de originele data hebt? Welnee!

Tableau Desktop en LOD-expressies kunnen al onze analytische vragen beantwoorden. Als we verbinding maken met het originele Verkeersovertredingen.xlsx(Link wordt in een nieuw venster geopend), lijkt dat erg op de gedraaide dataset, maar dan zonder het cruciale veld Overtredingsnummer. We moeten de uitkomst van de aggregatiestappen nabootsen via LOD-expressies.

Opmerking: u kunt de werkmap LOD-bestuurdersovertredingen.twbx(Link wordt in een nieuw venster geopend) downloaden om de oplossingen in context te bekijken. Houd er rekening mee dat er mogelijk alternatieve manieren zijn om de analyse te interpreteren of antwoorden te vinden.

1. Hoeveel dagen zaten er tussen de eerste en de tweede overtreding voor elke bestuurder?
2. Vergelijk de boetebedragen voor de eerste en tweede overtreding. Zijn ze gecorreleerd?
3. Welke chauffeur betaalde in totaal het meest? Wie betaalde het minst?
4. Hoeveel bestuurders begingen meerdere soorten overtredingen?
5. Wat was het gemiddelde boetebedrag voor bestuurders die nooit een verkeerscursus hadden gevolgd?

Houd er rekening mee dat deze oplossing veel geneste berekeningen en LOD-expressies bevat. Afhankelijk van de grootte van de dataset en de complexiteit van de data kunnen prestaties een probleem vormen.

Reflecteren over methoden

Welke route moet u dan nemen? Dat hangt helemaal van u af, en van de hulpmiddelen die u ter beschikking hebt.

  • Als u LOD's wilt vermijden, is er een datavormende oplossing, hoewel voor sommige analyses berekeningen nodig kunnen zijn (Analyse in Tableau Desktop).

  • Als u de data kunt vormgeven en vertrouwd bent met berekeningen, ook LOD's, biedt de middenwegoptie de meeste flexibiliteit (Nog een stap verder - gedraaide data).

  • Als u vertrouwd bent met LOD's, de impact op de prestaties minimaal is en/of u geen toegang hebt tot Tableau Prep, is het een haalbare optie om dit probleem alleen met LOD's op te lossen (Nog een extra stap verder - alleen berekeningen).

Het is op zijn minst nuttig om te begrijpen hoe aggregatie in Tableau Prep en Level of Detail-expressies in Tableau Desktop met elkaar samenhangen en hoe ze van invloed zijn op data-analyses. Zoals met de meeste dingen in Tableau is er meer dan één manier om iets te doen. Door alle verschillende opties te onderzoeken kunt u concepten bij elkaar brengen en de oplossing kiezen die voor u het beste is.

Gebruikte berekeningen:

Opmerking: speciale dank aan het Workout Wednesday-onderwerp Do Customers Spend More on Their First or Second Purchase?(Link wordt in een nieuw venster geopend) (Geven klanten meer uit aan hun eerste of hun tweede aankoop?) van Ann Jackson, en Andy Kriebels Tableau Prep-tip Returning the First and Second Purchase Dates(Link wordt in een nieuw venster geopend) (De eerste en tweede aankoopdatum retourneren), die de oorspronkelijke inspiratie voor deze zelfstudie vormden. Als u op deze links klikt, verlaat u de website van Tableau. Tableau neemt geen verantwoordelijkheid voor de juistheid of actualiteit van pagina's die worden onderhouden door externe aanbieders. Neem contact op met de eigenaren als u vragen hebt over hun inhoud.