Analys med det andra datumet i Tableau Desktop

Det här är den andra etappen av handledningen, vilket innebär att den första etappen Hitta det andra datumet med Tableau Prep måste ha slutförts.

I den första etappen tog vi vår ursprungliga datauppsättning och använde den för att svara på följande frågor:

  1. Hur lång tid i dagar förflöt mellan den första och den andra överträdelsen för respektive förare?

  2. Jämför bötesbeloppen för den första och den andra överträdelsen. Är de korrelerade?

  3. Vilken förare betalade mest totalt? Vem betalade minst?

  4. Hur många förare stod för flera typer av överträdelser?

  5. Vad var det genomsnittliga bötesbeloppet för förare som aldrig gått i körskola?

När vi nu granskar dessa frågor blir det tydligt att det finns vissa för- och nackdelar med den första datastruktur som vi skapat. Vi går tillbaka till Tableau Prep Builder och gör ytterligare några dataomvandlingar, för att sedan se hur det påverkar analysen i Tableau Desktop. Slutligen ska vi titta på en analysmetod med Tableau Desktop med hjälp av LOD-uttryck (detaljnivå) med ursprungliga data.

Målet med denna handledning är att presentera olika begrepp inom ramen för ett verkligt scenario och att testa olika alternativ – inte att föreskriva något som det bästa. I slutändan bör du ha fått en bättre känsla av hur datastrukturen påverkar beräkningar och analyser, samt större kännedom om olika aspekter av Tableau Prep och beräkningar i Tableau Desktop.

Obs! Du måste ha Tableau Prep Builder och eventuellt Tableau Desktop installerade och alla data nedladdade för att kunna slutföra uppgifterna i denna handledning.

Läs mer i Driftsättningsguide för Tableau Desktop och Tableau Prep(Länken öppnas i ett nytt fönster) för att installera Tableau Prep och Tableau Desktop, innan du fortsätter med denna handledning. Du kan även ladda ned kostnadsfria utvärderingsversioner av Tableau Prep(Länken öppnas i ett nytt fönster) och Tableau Desktop(Länken öppnas i ett nytt fönster).

Datauppsättningen är utdata från Driver Infractions.tflxsom byggdes under den första etappen.

Analys i Tableau Desktop

Nu när vi har konfigurerat våra data matar vi in dem till Tableau Desktop. Vi kan enkelt svara på vissa frågor, medan andra kräver några (eller många) beräkningar. Försök hitta svaren på frågorna nedan. Du kan öppna varje fråga för att få grundläggande information om hur man går till väga när man stöter på hinder.

Obs! Du kan ladda ner arbetsboken Driver Infractions.twbx(Länken öppnas i ett nytt fönster) för att titta på lösningarna i ett sammanhang. Tänk på att det kan finnas alternativa sätt att tolka analysen eller söka svar på.

1. Hur lång tid i dagar förflöt mellan den första och den andra överträdelsen för respektive förare?
2. Jämför bötesbeloppen för den första och den andra överträdelsen. Är de korrelerade?
3. Vilken förare betalade mest totalt? Vem betalade minst?
4. Hur många förare stod för flera typer av överträdelser?
5. Vad var det genomsnittliga bötesbeloppet för förare som aldrig gått i körskola?

Gå vidare – Pivoterade data

Trots att de data vi har arbetat med är välstrukturerade för att ta itu med frågor som rör första och andra överträdelser, är det inte den standardstruktur som rekommenderas för användning med Tableau Desktop. Ju mer vår analys avviker från grundläggande frågor som rör överträdelsedatumen, desto mer komplicerade blir våra beräkningar, för att kombinera relevant information så att den blir användbar.

När data lagras med flera kolumner för samma typ av data (till exempel två kolumner för datum, två kolumner för bötesbelopp o.s.v.) och unik information lagras i fältnamnet (till exempel om det är den första eller andra överträdelsen), är detta vanligtvis ett tecken på att data behöver pivoteras.

Detta kan hanteras på ett bra sätt genom att utföra flera pivoteringar i Tableau Prep Builder. Vi kan arbeta från slutet av flödet Föraröverträdelse i Tableau Prep, som skapats i föregående handledning Hitta det andra datumet med Tableau Prep.

Tips: Se till att du är tillbaka i Tableau Prep för stegen som följer.

  1. Lägg till ett steg för Pivotering där alla duplicerade fält pivoteras från det sista rensningssteget. Använd plusikonen i det övre högra hörnet av området Pivoterade fält för att lägga till flera Pivotvärden. Varje uppsättning av fält (till exempel 1:a och 2:a bötesbeloppet) ska pivoteras tillsammans.

    Mer information om pivotering finns i Rensa och forma data.

  2. I området Pivoterade fält, under kolumnen Pivot1-namn dubbelklickar du på varje värde och byter namn på dem till 1:a och 2:a.

    Konfigurationsrutan Pivot 1 i Tableau Prep som visar de fem pivoteringarna

Resultaten kan ställas i ordning genom att ta bort null-datum, ändra namn på fälten och flytta om dessa.

  1. Lägg till ett rensningssteg efter pivoteringen. Högerklicka på null-raden i kolumnen Överträdelsedatum och välj Uteslut.

  2. Dubbelklicka på fältnamnet Pivot1-namn och byt namn till Överträdelsenummer.

  3. Dra fälten efter behov för att flytta dem enligt anvisningarna nedan:

    Förhandsgranskning av pivoterade och rensade data

  1. Från nya, pivoterade data måste man skapa utdata som heter Pivoterade föraröverträdelser och mata in dem i Tableau Desktop. (Glöm inte att köra flödet efter att du har lagt till steget Utdata.)

Nu kan vi titta på våra fem frågor igen med denna pivoterade datastruktur. Du kan utöka varje fråga för grundläggande information om hur man går till väga om man stöter på problem.

Obs! Du kan ladda ner den slutförda flödesfilen Pivoted Driver Infractions.tflx för att kontrollera ditt arbete, eller ladda ner arbetsboken Pivoted Driver Infractions.twbx för att se lösningarna i ett sammanhang. Tänk på att det kan finnas alternativa sätt att tolka analysen eller söka svar på.

1. Hur lång tid i dagar förflöt mellan den första och den andra överträdelsen för respektive förare?
2. Jämför bötesbeloppen för den första och den andra överträdelsen. Är de korrelerade?
3. Vilken förare betalade mest totalt? Vem betalade minst?
4. Hur många förare stod för flera typer av överträdelser?
5. Vad var det genomsnittliga bötesbeloppet för förare som aldrig gått i körskola?

Fördelarna med pivoterade data

Vi kan hålla oss till den ursprungliga datastrukturen från handledningen, om vi vet att vi bara behöver svara på frågor som är lätta att besvara med den strukturen. Det pivoterade dataformatet är å andra sidan mer flexibelt. Även om det kräver vissa beräkningar är den resulterande datauppsättningen väl lämpad att svara på bredare frågor när de väl har gjorts.

Gå vidare – Endast beräkningar

Vad händer om du inte har åtkomst till Tableau Prep Builder? Är det helt kört om du är fast med dina ursprungliga data? Inte alls!

Tableau Desktop och LOD-uttryck kan svara på alla analytiska frågor. Om vi ansluter till den ursprungliga Traffic Violations.xlsx(Länken öppnas i ett nytt fönster), liknar den väldigt mycket den pivoterade datauppsättningen, men utan det avgörande fältet Överträdelsenummer. Vi måste efterlikna resultatet av aggregeringsstegen via LOD-uttryck.

Obs! Du kan ladda ner arbetsboken LOD Driver Infractions.twbx(Länken öppnas i ett nytt fönster) för att titta på lösningarna i ett sammanhang. Tänk på att det kan finnas alternativa sätt att tolka analysen eller söka svar på.

1. Hur lång tid i dagar förflöt mellan den första och den andra överträdelsen för respektive förare?
2. Jämför bötesbeloppen för den första och den andra överträdelsen. Är de korrelerade?
3. Vilken förare betalade mest totalt? Vem betalade minst?
4. Hur många förare stod för flera typer av överträdelser?
5. Vad var det genomsnittliga bötesbeloppet för förare som aldrig gått i körskola?

Det är viktigt att komma ihåg att denna lösning har många kapslade beräkningar och LOD-uttryck. Beroende på datauppsättningens storlek och datakomplexiteten kan prestanda vara ett problem.

Reflektion över metoder

Vilken väg ska du ta? Det är helt upp till dig och de verktyg som står till ditt förfogande.

  • Om du vill undvika LOD-beräkningar finns det en lösning för att forma data, fast beräkningar kan vara nödvändiga för vissa analyser (Analys i Tableau Desktop).

  • Om du kan forma data och är bekväm med beräkningar – inklusive LOD-beräkningar – ger alternativet som utgör medelvägen den bästa flexibiliteten (Gå vidare – Pivoterade data).

  • Om du är bekväm med LOD-beräkningar, det finns minimal inverkan på prestandan, och/eller du inte har åtkomst till Tableau Prep, går det att lösa detta med endast LOD-beräkningar (Gå vidare – Endast beräkningar).

Åtminstone är det värdefullt att förstå hur aggregeringen i Tableau Prep och LOD-uttrycken i Tableau Desktop hänger ihop och påverkar dataanalysen. Som med det mesta i Tableau finns det mer än ett sätt att göra saker på. Att utforska alla olika alternativ kan hjälpa dig att göra ordning bland begreppen, så att du kan välja den bästa lösningen för dig.

Använda beräkningar:

Obs! Ett särskilt tack till Ann Jacksons Workout Wednesday-ämne Lägger kunderna ut mer på sina första eller andra köp?(Länken öppnas i ett nytt fönster) och Andy Kriebels Tableau Prep-tips Returnera datum för första och andra inköp(Länken öppnas i ett nytt fönster), vilka inspirerade till den här handledningen. Om du klickar på de här länkarna kommer du att lämna Tableaus webbplats. Vad gäller sidor som underhålls av externa parter kan Tableau inte ta ansvar för riktigheten på dessa sidor eller garantera att de är uppdaterade. Kontakta ägarna om du har frågor om deras innehåll.