Tips på hur du kan arbeta med dina data
Data kan organiseras på olika sätt. För att dra nytta av Tableau Desktop rekommenderar Tableau att du ansluter till data som formaterats för analys. Data som alltså är:
så detaljerade som möjligt i stället för aggregerade (t.ex. dagliga väderdata i stället för månatliga medelvärden)
organiserade som en databastabell (i stället för en kolumnbaserad tabell, till exempel en korstabell)
utan okänd information (allt som inte är data och rubriker)
När data struktureras för analys är det mycket enklare att ställa och svara på frågor. Tableau kan aggregera rådata till önskad nivå, i stället för att begränsas av de aggregeringar som redan finns i dessa data. Grupper och hierarkier kan skapas efter behov och beräkningar kan utföras i analysflödet.
Tableau Desktop har grundläggande rensningsalternativ och datatolken. Tableau Prep kan vara nödvändigt för mer komplexa formateringsfrågor.
Följande Tableau Desktop-specifika avsnitt belyser och ger förslag för att lösa vanliga formateringsfrågor eller -problem som kan göra det svårt att analysera dina data.
Pivoterade data i korstabellsformat
När data formateras som i korstabellsformat är tabellen kolumnbaserad. I en kolumnbaserad tabell lagras variablerna som kolumnrubriker. Tableau Desktop är å andra sidan optimerad för radbaserade data. I en radbaserad tabell lagras variablerna i radvärden.
Anta till exempel att du har en kolumnbaserad tabell som visar betygen i matematik, naturvetenskap och historia för elever i grundskolan.
Tableau Desktop är optimerad för att ansluta till radbaserade tabeller, där värdena matematik, naturvetenskap och historia är organiserade under en kolumn som heter ”Ämne” och betygen för varje elev är organiserade under en kolumn som heter ”Betyg”. Du kan pivotera kolumnerna i raderna genom att redigera Excel-data manuellt. I annat fall kan du ansluta till dina Excel-data från Desktop och sedan använda alternativet Pivotering. Mer information om hur du pivoterar data finns i Pivotera data från kolumner till rader.
Ta bort föraggregerade data
Data kan ofta vara föraggregerade. Det vill säga att dessa data kan innehålla summor, medelvärden, medianer o.s.v. Ett vanligt exempel på föraggregerade data är delsummor och slutsummor. Delsummor och slutsummor beräknas utifrån rådata, men ingår inte i själva rådatan.
Anta till exempel att du har en tabell som innehåller en rad med information om delsummor.
I detta fall måste dessa föraggregerade data tas bort. Om du vill använda delsummor och slutsummor i analysen tar du bort denna typ av information manuellt från tabellen. Anslut sedan dina Excel-data från Desktop och beräkna delsummor och totalsummor med hjälp av alternativet Totalsummor. Mer information finns i Visa totalsummor i en visualisering. I annat fall kan du ansluta till dina Excel-data från Desktop, sätta på datatolken och därefter använda alternativet Totalsummor. Mer information finns i Rensa data i Excel, CSV, PDF och Google Kalkylark med Datatolken.
Ta bort eller utesluta introduktionstexten
Excel-data som levereras som en rapport kan innehålla titlar eller block av introduktionstext. Eftersom Desktop förväntar sig antingen kolumnrubriker eller radvärden på den första raden i en tabell, kan denna information orsaka problem i samband med analysen.
Anta till exempel att du har en tabell som innehåller en rapporttitel och ett rapportdatum.
I detta fall måste titel- och datuminformationen tas bort. Om du vill använda en titel och ett datum för en rapport gör du något av följande:
- Ta bort denna information manuellt från dina Excel-data. Anslut sedan till dina Excel-data från Desktop och lägg till en rapporttitel med hjälp av alternativet Titel. Du hittar mer information i Formatera enskilda delar av vyn.
- Anslut till dina Excel-data från Desktop, sätt på datatolken och använd därefter alternativet Titel. Mer information finns i Rensa data i Excel, CSV, PDF och Google Kalkylark med Datatolken.
- Om du inte kan ta bort denna information från dina Excel-data skapar du ett namngivet intervall och ansluter till det namngivna intervallet från Desktop. Mer information finns i Excel.
Jämna ut hierarkiska rubriker till en enda rad
Rent allmänt förväntar sig Tableau Desktop att endast den första raden i dina Excel-data innehåller kolumnrubriker. Data som innehåller flera lager av kolumnrubriker kan orsaka problem i samband med analysen.
Anta till exempel att du har en tabell som innehåller en huvudrubrik och flera underrubriker.
I detta fall måste hierarkin för rubrikerna jämnas ut eller tas bort. För att göra detta kan du manuellt skapa en ny kolumn för varje rubrik i hierarkin, direkt i dina Excel-data. I annat fall kan du ansluta till dina Excel-data från Tableau Desktop och sedan sätta på datatolken. Kontrollera att rubrikerna har jämnats ut på rätt sätt. Mer information om datatolken finns i Rensa data i Excel, CSV, PDF och Google Kalkylark med Datatolken.
Se till att det inte finns några tomma celler
Om du skapar nya kolumner för dina hierarkiska rubriker måste du se till att varje cell i de nya kolumnerna innehåller värden.
Även om du upprepar samma värde för varje rad är det viktigt att varje rad innehåller de data som är associerade med de data som var lagrade i den hierarkiska rubriken. Du måste ta bort tomma celler manuellt från dina Excel-data.
Ta bort tomma rader
Se till att det inte finns några tomma rader i dina data. För att åtgärda tomma rader måste du ta bort de tomma raderna från dina Excel-data.
Lägga till rubriker som saknas
Se till att inga kolumnrubriker saknas. För att åtgärda rubriker som saknas måste du lägga till de rubriker som saknas manuellt, direkt i dina Excel-data.