När ska en datamodell för relationer mellan faktatabeller användas?

En datamodell för relationer mellan faktatabeller är en med vilken du kan lägga till orelaterade tabeller i en och samma datakälla, där relaterade fält sedan används i den visuella analysen för att i princip sammanfoga tabellerna baserat på sammanhanget. Till skillnad från kombinationer existerar data i en enda datakälla – begreppen primära och sekundära datakällor är inte relevanta och inga data tas bort från vänsterkopplingar. Till skillnad från en datamodell med en tabell så har en med flera bastabeller sitt eget sammanhang med avseende på de tabeller som de delar. Med en datamodell för relationer mellan faktatabeller har du fler alternativ för att utföra analys av flera faktatabeller i Tableau.

Tänk dig att du vill analysera hur väder och glassförsäljning utvecklas tillsammans. Vädret och glassförsäljningen ”sker” båda vid specifika tidpunkter och på specifika platser, men det finns inget direkt samband mellan glassförsäljning och väder. Detta är orelaterade data som båda relaterar till de delade begreppen datum och plats.

Därför passar det bra att skapa en datamodell för relationer mellan faktatabeller. Glassförsäljningen och vädret kan läggas till som var sin bastabell och relateras för datum och plats, som är delade tabeller.

En datamodell med flera bastabeller, två bastabeller och två delade tabeller

En datamodell med flera bastabeller med två orelaterade tabeller (Ice Cream Sales och Weather) och två delade tabeller (Date och Location). Det finns en mellanliggande tabell, Parlor Info, mellan Ice Cream Sales och Location.

Varför har vi utvecklat en funktion för att modellera orelaterade tabeller?

Analys innebär ofta att du sammanför datatabeller som inte ens har en direkt relation till varandra, men som båda relaterar till samma delade information (som datum eller plats). En datamodell för relationer mellan faktatabeller har stöd för lös semantisk koppling tack vare olika relationsgrader och möjligheten att bygga en datamodell med flera orelaterade bastabeller.

  • Semantisk koppling är en term som används för att beskriva hur väl sammankopplade data är. En koppling eller en förening är en hård semantisk koppling, som sammanfogar flera tabeller till en ny fysisk tabell som sedan fungerar som en enda tabell. En relation är en lösare koppling mellan tabeller som kopplar samman tabeller logiskt och bevarar deras distinkta status som separata tabeller. Ytterligare en semantisk koppling är datakombination, där resultatet från separata datakällor kombineras visuellt baserat på element som de delar. En modell för relationer mellan faktatabeller liknar en kombination mer, men inom en enda datakälla i stället för flera.

I en datamodell för relationer mellan faktatabeller kan orelaterade tabeller användas förutsatt att det även finns delade tabeller i modellen. Fält från en delad tabell ”sammanfogar” under analysen för övrigt orelaterade datatabeller baserat på de dimensioner som de har gemensamt (till exempel samma plats eller samma tidpunkt). Alla fördelar med relationer bibehålls, bland annat bevaras varje tabells inbyggda detaljnivå.

På samma sätt som i en datamodell med en enda bastabell avgör Tableau vilken kopplingstyp som passar bäst att använda baserat på visualiseringens struktur. Men i en modell för relationer mellan faktatabeller utökas kopplingsalternativen så att de omfattar yttre kopplingar och korskopplingar för att hantera olika relationsnivåer. Mer information finns i Om datamodeller för relationer mellan faktatabeller.

Om terminologin

Relationer mellan faktatabeller hänger ihop med analys av flera faktatabeller. I en datalagermodell lagras data i en central faktatabell som är omgiven av dimensionstabeller. I det här sammanhanget avser fakta mått eller mätvärden, numeriska datafält som innehåller fakta om dessa data – Tableaus mätvärden. Dimensionstabellerna innehåller attribut om dessa fakta.

Scheman som bygger på faktatabeller är ofta strukturerade som stjärn- eller snöflingescheman, beroende på hur dimensionstabellerna är strukturerade. När flera faktatabeller behöver analyseras kallas detta analys av flera faktatabeller. Analysen utförs för de gemensamma dimensionstabellerna,som kallas delade eller samordnade dimensioner. I Tableau bygger du de här datamodellerna med hjälp av relationer, och därför kallar vi den här gruppen med funktioner för relationer mellan flera faktatabeller.

När ska datamodeller för relationer mellan flera faktatabeller användas?

Om data består av tabeller som alla är relaterade till varandra, kan du hålla dig till datakällor med en bastabell som bygger på relationer. En datamodell för relationer mellan faktatabeller behövs när data omfattar olika begrepp, antingen som flera faktatabeller eller olika orelaterade sammanhang.

Du bör om möjligt bygga datakällor med en enda bastabell. I en datamodell med en enda bastabell är alla tabeller relaterade och det finns inget behov av att beakta relationsgraden. Använd bara datamodeller för relationer mellan flera faktatabeller när det verkligen behövs.

Analys av flera faktatabeller

Analys av flera faktatabeller är ett centralt användningsområde för relationer mellan faktatabeller i Tableau. I det här exemplet delar Faktum A och Faktum B tabellen för datum.

en datamodell för flera faktatabeller

För att modellera detta i Tableau blir faktatabellerna bastabeller och flera inkommande relationer upprättas för deras delade dimensionstabell.

en datamodell för relationer mellan faktatabeller

Andra scenarier

Datamodeller för relationer mellan flera faktatabeller kan användas till mer än analys. Tableau kräver ingen strikt definition av fakta- eller dimensionstabeller. Alla tabeller kan vara bastabeller (men de måste stämma överens med egenskaperna hos bastabeller). Några scenarier som tyder på att en datakälla med flera bastabeller kan vara användbar är till exempel följande: 

  • Olika faser, som bastabeller för program, transkriptioner och alumnevenemang för en delad studenttabell.
  • Olika sammanhang för samma händelser, som bastabeller för läkarbesök och fakturor, med delade tabeller för att ange sammanhanget för läkare eller patienter.
  • Olika domäner som kan korrelera, som scenarier som tidigare sköttes bäst med datakombination, till exempel glassförsäljning och väder som korreleras med delade tabeller för datum och plats.

Lär dig mer om när relationer mellan faktatabeller är användbara i detta Tableau-blogginlägg: När och hur du använder relationer mellan faktatabeller i Tableau (på engelska).

Identifiera bastabeller

I en datamodell för relationer mellan faktatabeller är riktningen viktig. Det betyder att vilka tabeller som är bastabeller längs modellens vänstra sida och vilka tabeller som delas nedströms påverkar hur relationerna utvärderas för att returnera analysresultatet.

Ta till exempel ett konceptuellt diagram över fakturor, inbokade besök, läkare och patienter:

En datamodell med fakturor och inbokade besök på utsidan och läkare och patienter i mitten

Det rätta sättet att bygga datamodellen i Tableau är med fakturor och inbokade besök som bastabeller och med läkare och patienter som delade tabeller (inte med läkare och patienter som bastabeller).

Korrekt: Fakturor och inbokade besök som bastabeller

Inkorrekt: Läkare och patienter som bastabeller

En datamodell med flera bastabeller med fakturor och inbokade besök som bastabeller och läkare och patienter som nedströms delade tabellerEn datamodell med flera bastabeller med läkare och patienter som bastabeller och fakturor och inbokade besök som nedströms delade tabeller

Begreppsmässigt är en patient (eller läkare) den enhet som sammanfogar händelsen ”inbokat besök” och händelsen ”faktura”.

Om datamodellen är omvänd (till exempel med läkare och patienter som bastabeller i stället för inbokade besök och fakturor) är sammanfogning av yttre kopplingar inte lika användbart. Analysen kan då uppvisa tvetydigheter och många mätvärden på tabellnivå. Om du får tvetydigt relaterade fält som du inte förväntade dig bör du utvärdera de tabeller du använder som bastabeller igen och kontrollera om du behöver vända på datamodellen.

Egenskaper för bastabeller och delade tabeller

Om du utför analys av flera faktatabeller blir faktatabellerna bastabeller och alla delade dimensionstabeller är delade tabeller. Tableau kräver inte att egenskaperna för fakta- och dimensionstabeller följs strikt. Det finns emellertid vissa attribut som kan hjälpa dig att identifiera vilka tabeller som ska vara bastabeller och vilka som ska vara delade tabeller.

Bastabell

Delad tabell

Faktatabeller i ett datalagerschema

Delade eller samordnade dimensionstabeller i ett datalagerschema

Specifik för sammanhanget eller analysen

(flyginformation, energianvändning)

Konsekvent begrepp i flera sammanhang

(datum, plats)

Många mätvärden

I huvudsak dimensioner

Uppdateras oftare/transaktionsbaserad

(läkarbesök, recept, vitalparametrar)

Mer stabil/hållbar

(läkare, patient)

Har fält för sekundärnyckel

Har fält för primärnyckel

Händelsebaserad

(klassschema, betyg på en uppgift)

Enhetsbaserad

(student, klassrum)

Tänk på att om det finns mellanliggande tabeller mellan en bastabell och en delad tabell kan du byta den som används som bastabell utan att ändra datamodellen i något större avseende. (Till exempel Parlor Info och Ice Cream Sales i det första exemplet.) Det viktiga är vilka tabeller som ligger uppströms från de delade tabellerna och vilka som delas.

Prova en extra bastabell i stället

Det finns olika scenarier där det kan vara lämpligt att bygga en modell för relationer mellan flera basfaktatabeller snarare än att använda en datakälla med en enda bastabell:

  • Om du vill bygga en datakälla med en cykel bör nedströmstabellen vara en annan bastabell i stället.
  • Om du har en serie tabeller som är relaterade till samma uppsättningar med relationssatser (som datum och plats), bör dessa dimensioner plockas ut och omvandlas till delade tabeller i stället.
    • Detta är praktiskt eftersom flera relationssatser alla måste vara sanna (logiskt sett OCH) för att tabellerna ska vara relaterade för dessa poster.
    • Om du i stället vill analysera poster där en i taget kan vara sann (kontextuellt ELLER) skapas den här flexibiliteten i stället genom att du konfigurerar en datamodell med delade dimensionstabeller.
  • Om du använder en kombination och vill ha en likartad kombination utan primära och sekundära datakällor, bygger du en datamodell som kombinerar datakällorna från kombinationen med deras länkningsfält i en eller flera delade tabeller.
Tack för din feedback!Din feedback har skickats in. Tack!