Planera datakällan

I centrum av Tableau finns dina data. Hur framgångsrikt du kan utforska data, besvara frågor och skapa visualiseringar som du själv och andra kan använda sig av är helt beroende av de underliggande data.

Om målet är att göra en snabb utforskning eller lite ad-hoc analys så kanske det räcker att hoppa in, ansluta till lite data, dra och släppa för att skapa några visualiseringar och hoppa ut med den information du behöver. Men om målet är att skapa en analys eller datakälla som ska användas mer än en gång så är det bäst att tänka igenom och planera din datakälla.

Tableau-datakällor

En Tableau-datakälla är länken mellan dina källdata och Tableau. Det är i princip summan av dina data (antingen som liveanslutning eller extrakt), anslutningsinformationen, namnen på tabeller eller blad som innehåller data, samt de anpassningar du utför av dessa data för att arbeta med dem i Tableau. Anpassningarna innefattar sådant som hur data kombineras och metadata som beräkningar, namnbytta fält och standardformatering.

En Tableau-datakälla kan innehålla flera dataanslutningar till olika databaser eller filer. Anslutningsinformation innefattar var data befinner sig, exempelvis filnamn och sökväg eller en nätverksresurs och information om hur man ansluter till dina data, som ett databasservernamn och inloggningsuppgifter.

Obs! Termerna datakälla och dataanslutning har använts utan urskiljning tidigare och kan sakna tydlig åtskillnad i tidigare material.

Det är även viktigt att tänka på skillnaden mellan Tableau-datakällor (Tableaus tillgång till dina data och alla anpassningar som kan vara inblandade) och själva källdatan (exempelvis en databas eller ett Excel-kalkylblad). Planering av en datakälla i avseendet att designa en databas är inte vad det här ämnet handlar om.

Tableau-datakällor kan fortsätta vara inbäddade i den arbetsbok där de ursprungligen skapades, eller så kan de publiceras separat. Publicerade datakällor tillåter centralisering och skalning av kurerade datakällor. Mer information finns i Bästa praxis för att publicera datakällor.

Kombinera data

Om dina data kommer från en tabell så kan du ansluta till dina data för att skapa datakällan, dra tabellen till arbetsytan och börjar bygga din vy. Men om dina data är utspridda över flera tabeller – eller över flera databaser – så behöver du kombinera dem. Kombinering av data sker på sidan Datakälla.

Enskild databasFlera databaser
  1. Anslut till dina data. När du gör det skapas en datakälla.
  2. Dra en tabell eller ett blad med data och släpp det på arbetsytan.
  3. Dra en andra tabell eller blad till arbetsytan och släpp det. Antingen visas en krökt linje som representerar den relation som Tableau skapar automatiskt för de två tabellerna, eller så öppnas dialogrutan Redigera relation, där du uppmanas att ange nyckelfälten som kopplar ihop tabellerna med varandra.
  4. Fortsätt att lägga till tabeller.
  1. Anslut till dina data. När du gör det skapas en datakälla.
  2. Dra en tabell eller ett blad med data och släpp det på arbetsytan.
  3. Efter att du tagit ut den första tabellen med data klickar du på länken Lägg till till höger om rubriken Anslutningar i det vänstra fönstret.
  4. Växla mellan dataanslutningar i det vänstra fönstret och dra önskad tabell till arbetsytan och släpp den. Antingen visas en krökt linje som representerar den relation som Tableau skapar automatiskt för de två tabellerna, eller så öppnas dialogrutan Redigera relation, där du uppmanas att ange nyckelfälten som kopplar ihop tabellerna med varandra.
  5. Fortsätt att lägga till tabeller och växla mellan dataanslutningar efter behov.

Obs! För att relatera tabeller mellan olika databaser så måste de läggas till som dataanslutningar inom samma datakälla, inte som en ny datakälla. Dataanslutningar läggs till från Lägg till-länken i det vänstra fönstret. Nya datakällor kan skapas från Data-menyn eller listmenyn från ikonen bredvid datakällans namn som det visas i bilden nedan.

Metoder för att kombinera data

Relationer är standardsättet att kombinera data i Tableau. Relationer är ett dynamiskt, flexibelt sätt att kombinera och analysera data från flera tabeller. Vid behov kan tabeller även kopplas och förenas. Datakällor kan även kombineras. Vi tar en titt på alternativen för hur data kan kombineras i Tableau och vissa av de situationer där varje metod är användbar.

 

RelationerFastställer potentialen för kopplingar mellan två tabeller baserat på relaterade fält. Slår inte samman data för att skapa en ny, fast tabell. Under analys frågas de relevanta tabellerna automatiskt med hjälp av de sammanhangslämpliga kopplingarna för att skapa en anpassad tabell med data för den analysen.

Bibehåller lämplig detaljnivå, orsakar inte dataförlust, behåller lämpliga aggregeringar och hanterar null.

KopplingarSlå samman två tabeller med data baserat på en kopplingssats och kopplingstyp för att skapa en ny fast tabell med data. Används ofta för att lägga till nya kolumner med data över samma grundläggande radstruktur.

Kan orsaka dataförlust med vissa kopplingstyper om fält inte förekommer i alla tabeller. Kan orsaka dataduplicering om tabeller har olika detaljnivå.

FöreningarSlå samman två eller fler tabeller med data för att skapa en ny, fast tabell med data. Används för att bifoga (lägga till nya rader med) data över samma grundläggande kolumnstruktur.
KombinationerArbeta mellan två eller flera separata Tableau-datakällor. Data hålls separat. Tableau frågar datakällorna oberoende av varandra och visualiserar resultaten tillsammans i vyn baserat på länkningsfält som upprättats för det bladet. Efterliknar beteendet för en vänsterkoppling och kan filtrera data från sekundära datakällor.

Obs! Det går även att kombinera data med anpassad SQL. Oftast är det bäst att kombinera data direkt på arbetsytan eller med Kombinerade data. På så sätt får Tableau störst flexibilitet för optimering. I vissa scenarion kan det dock finnas skäl till att använda anpassad SQL. Tänk dock på att det kan påverka prestandan eftersom Tableau tvingas köra de anpassade SQL-satserna som de står skrivna.

Relationer

Relatera är en metod för att arbeta med data från flera tabeller baserat på delade fält – kolumner – mellan dessa tabeller. Om du etablerar en relation informeras Tableau om hur rader kan anslutas mellan tabeller. Tableau sparar den informationen, men för inte omedelbart samman raderna som med en hårdkodad koppling. När en visualisering skapas spåras i stället de fält som ingår i analysen tillbaka via relationen och lämpliga kopplingar skapas för att returnera rätt data.

Eftersom data aldrig tvingas samman i en enskild tabell utanför visualiseringens sammanhang så är relationer användbara när data befinner sig på olika detaljnivå. Om du till exempel behöver arbeta med data om daglig nederbörd i en tabell men temperatur per timme i en annan.

Mer information om hur du kombinerar tabeller med hjälp av relationer finns i Relatera data.

Mer information om hur du kan kombinera tabeller med hjälp av relationer finns i Relatera data och de här Tableau-blogginläggen:

Obs! I Tableau version 2024.2 och senare har Tableaus funktioner för datamodellering stöd för analys av flera faktatabeller och delade dimensioner med hjälp av relationer mellan faktatabeller. Mer information finns i Om datamodeller för relationer mellan faktatabeller(Länken öppnas i ett nytt fönster), När ska en datamodell för relationer mellan faktatabeller användas?(Länken öppnas i ett nytt fönster) och Bygga en datamodell för relationer mellan faktatabeller(Länken öppnas i ett nytt fönster).

Koppla

Koppling är ett sätt att kombinera tabeller relaterade med gemensamma fält. Resultatet av att kombinera data med hjälp av en koppling är en tabell som utökas i vågrät riktning genom att lägga till kolumner med data.

Mer information om hur du kopplar data i Tableau finns i Koppla dina data.

Kombinerade data

När du använder Kombinerade data för att kombinera dina data så kombinerar du data i vad som kallas en primär datakälla med gemensamma fält från en eller flera sekundära datakällor.

Datakombination är användbart när du behöver ändra hur datakällan konfigureras blad för blad, när du vill kombinera databaser som inte tillåter relationer eller kopplingar som kubdatakällor eller publicerade datakällor.

Resultatet av att kombinera data med Kombinerade data är en virtuell tabell som utökas vågrätt genom att lägga till kolumner med data. Data från varje datakälla aggregeras till en gemensam nivå innan de visas tillsammans i visualiseringen.

Mer information om hur Kombinerade data fungerar och hur du kombinerar dina data i Tableau finns i Kombinera data.

Förena

Förening är en metod för att lägga till värden (rader) till tabeller. Du kan förena tabeller om de har samma kolumner. Resultatet av att kombinera data med en förening är en virtuell tabell som har samma kolumner men som utökas lodrätt genom att lägga till rader med data.

Du kan förena tabeller på ett av två sätt: manuellt eller med jokerteckensökning. Mer information om hur du förenar data med en av dessa metoder i Tableau finns i Förena dina data.

Överväganden för en Tableau-datakälla

Innan något annat bör du se till att du är på det klara med vad datakällans syfte ska vara. Om du skapar en uppsamlingsdatakälla för en rad olika användare med breda frågor så gör du det på ett annat sätt än om du skapar en nischad datakälla som optimerats för prestanda. Det är viktigt att veta målet från början.

Med det målet i åtanke finns det flera saker att överväga och planera innan du skapar en datakälla i Tableau:

  • plats och åtkomst
  • form och renhet
  • Datamodellen och kombinera data
  • Metadata och anpassning
  • Skalbarhet, säkerhet och synlighet
  • prestanda och ålder på data.

plats och åtkomst

Platsen där du har dina data kan vara enkel, till exempel en Excel-fil på datorn eller ett Google Sheet du skapat, eller komplicerad, som flera databaser som använder sig av olika tekniker. Åtkomst kan även involvera specifika drivrutiner eller kopplingar för en databas eller inloggningsinformation för en databasserver.

Frågor att ha i åtanke:

form och renhet

Din organisation kanske redan har välstrukturerade data som du kan ansluta till eller ETL-processer du kan använda dig av, eller så kan du behöva använda Tableau Prep Builder och utföra rensnings- och formningsåtgärder för att få dina data i ett användbart format.

Frågor att ha i åtanke:

  • Är data välstrukturerade för användning i Tableau?
  • Ska Tableau Prep Builder och Tableau Prep Conductor användas för att rensa och automatisera dataförberedelseflöden?
  • Vilka beräkningar eller manipuleringar utförs bäst i Tableau?
  • Är några av dessa data onödiga? Saknas data?

Datamodellen och kombinera data

Tableau behöver veta hur den ska fråga data, det berättar du i Tableaus datamodell. Om data kommer från flera tabeller behöver de kombineras. Metoder för att kombinera data innefattar relationer, kopplingar, föreningar och kombinationer.

Frågor att ha i åtanke:

  • Är data utspritt över flera system?
  • Vad är det bästa sättet att kombinera varje tabell med data?

Metadata och anpassning

Data lagras ofta på ett sätt som inte är enkelt för en person att använda på ett bekvämt sätt. Standardfältnamn kan till exempel vara klumpiga, anpassad formatering kanske önskas, definitioner av förkortningar eller koder kanske saknas eller så saknas vanliga beräkningar i de underliggande data. Om du skapar ett semantiskt lager med de informationsbitarna så kan det bli mycket enklare att förstå och använda data.

Frågor att ha i åtanke:

  • Vilka beräkningar ska läggas till?
  • Är tabell- och fältnamnen begripliga?
  • Är standardinställningarna för fälten användbara eller ska de anpassas?
  • Finns det justeringar som behöver göras för att stödja Tableau Catalog?
    Observera att Förklara data för tillfället inte stödjer flertabellsdatakällor.

Skalbarhet, säkerhet och synlighet

En datakälla kan ligga kvar i arbetsboken där den skapades – en inbäddad datakälla – eller så kan den publiceras till Tableau Server eller Tableau Cloud utan någon analys som en helt egen innehållstillgång. Med den här centraliseringen av publicerade datakällor får du dessutom fördelen med säkerhet och skalning så att flera användare kan ha tillgång till en konsekvent datakälla. Publicerade datakällor kan också dra nytta av Tableau Catalog och rekommendationer och erbjuda en enda sanningskälla för en organisation.

Frågor att ha i åtanke:

  • Ska datakällan vara inbäddad i arbetsboken?

(Följande frågor antar att datakällan är publicerad)

prestanda och ålder på data.

Dessutom kan Tableau-datakällor vara liveanslutningar till källdata eller så kan data kopieras ut som ett uppdateringsbart extrakt. Extrakt kan öka analysprestanda eller förhindra överutnyttjande av resurser mot databassystem.

Frågor att ha i åtanke:

Bygg datakällor med hög kvalitet

Det finns mycket att tänka på om du vill skapa en väldesignad och effektiv datakälla. Med du behöver inte publicera ditt första försök. Precis som när man skapar en bra visualisering så är det en pågående process att skapa en datakälla. Testa att kombinera de data du tror att du behöver och se om du kan skapa den visualisering du vill ha. Du kan alltid gå tillbaka och skriva en ny beräkning eller ta in en annan tabell med data. Utför lite användartester och fråga en kollega om de förstår dina fältnamn.

Det är förstås bäst att endast publicera datakällor du litar på och endast certifiera de som genomgått kvalitetskontroll. När din datakälla presenteras för användarna så ska de kunna lita på den.

Tack för din feedback!Din feedback har skickats in. Tack!