Extrahera data
Ett dataextrakt är en delmängd av information som sparas separat från den ursprungliga datauppsättningen. Det tjänar två syften – att förbättra prestanda och att använda Tableau-funktioner som kanske inte är tillgängliga eller stöds i dina ursprungliga data. Genom att skapa ett dataextrakt kan du effektivt minska den totala datavolymen genom att tillämpa filter och ställa in andra begränsningar.
När ett dataextrakt har skapats kan det uppdateras med den senaste informationen från den ursprungliga källan. Under uppdateringsprocessen har du möjlighet att välja mellan en fullständig uppdatering som ersätter allt befintligt innehåll i extraktet och en inkrementell uppdatering som bara lägger till rader som är nya sedan föregående uppdatering.
Fördelar med extrakt
- Hantera stora datauppsättningar: Extrakt kan hantera enorma mängder data, ända upp till miljardtals rader. Det gör att användarna kan arbeta effektivt med omfattande datauppsättningar.
- Förbättrade prestanda: Att interagera med vyer som använder extraktdatakällor resulterar i bättre prestanda jämfört med vyer som är kopplade direkt till dina ursprungliga data. Extrakt optimerar frågeprestandan, vilket resulterar i snabbare dataanalys och visualisering.
- Förbättrad funktionalitet: Extrakt ger tillgång till ytterligare Tableau-funktioner som kanske inte är tillgängliga eller stöds av den ursprungliga datakällan, som specifika funktioner.
- Dataåtkomst offline (Tableau Desktop): Extrakt möjliggör offlineåtkomst till data. Det innebär att användarna fortfarande kan spara, ändra och arbeta med data lokalt även när den ursprungliga datakällan inte är tillgänglig.
Skapa ett extrakt
Det finns flera sätt att skapa ett extrakt på, men det huvudsakliga tillvägagångssättet förklaras nedan.
- När du har anslutit till dina data och ställt in datakällan på sidan Datakälla väljer du Extrahera högst upp till höger och väljer därefter länken Redigera för att öppna dialogrutan Extrahera data.
- Expandera varje avsnitt för att se dess alternativ eller välj Expandera alla. Mer information om varje avsnitt finns längre ner i det här ämnet.
- Datalagring: Växla mellan Logiska tabeller och Fysiska tabeller.
- Filter: Ställ in filter för att begränsa hur mycket data som extraheras baserat på fälten och deras värden.
- Aggregering: Välj Aggregera data för synliga dimensioner för att aggregera mätvärdena med standardaggregeringen. Du kan även välja Summera datum på en viss datumnivå, t.ex. år eller månad.
- Antal rader: Ställ in hur många rader du vill extrahera. Du kan extrahera Alla rader, Exempel eller de Översta N raderna.
- Inkrementell uppdatering: Ställ in en inkrementell uppdatering baserat på en specifik kolumn och ett datumintervall. Du kan även välja om de sista raderna ska ersättas eller läggas till.
- När du är klar väljer du Spara inställningar.
- Välj bladfliken. Det initierar skapandet av extraktet.
- Välj därefter en plats att spara extraktet på.
- Ange extraktets filnamn.
- Välj Spara. Se avsnittet Felsök extrakt om dialogrutan Spara inte visas.
Extrahera inställningsbeskrivningar
Du kan konfigurera flera olika inställningar när du skapar ett extrakt.
Under Datalagring kan du välja antingen logiska eller fysiska tabeller. Logiska tabeller lagrar data i en extrakttabell för varje logisk tabell i datakällan. Fysiska tabeller lagrar i stället data i en extrakttabell för varje fysisk tabell i datakällan.
Båda alternativen med logiska och fysiska tabeller påverkar endast hur data i ett extrakt lagras. Alternativen påverkar inte hur tabeller i extraktet visas på sidan Datakälla.
Anta till exempel att ditt extrakt består av en logisk tabell som innehåller tre fysiska tabeller. Om du öppnar extraktfilen (.hyper) som har konfigurerats för att använda standardalternativet (Logiska tabeller) visas en tabell på sidan Datakälla. Om du öppnar extraktet med hjälp av den paketerade datakällsfilen (.tdsx) eller datakällsfilen (.tdsx) med dess motsvarande extraktfil (.hyper) visas alla tre tabeller som utgör extraktet på sidan Datakälla.
Logiska tabeller
Tableau använder logiska tabeller som standardstruktur för lagring av extraktdata. Tableau rekommenderar i allmänhet att du använder standardalternativet för datalagring (Logiska tabeller) när du ställer in och arbetar med extrakt. Många av de funktioner som du kan vilja ha, som extraktfilter, aggregering, översta n posterna eller genomflödesfunktioner (RAWSQL), är endast tillgängliga för dig om du använder alternativet Logiska tabeller. Du kan dock inte lägga till data i extrakt som har fler än en logisk tabell.
Om du väljer alternativet Logiska tabeller och extraktet innehåller kopplingar används kopplingarna när extraktet skapas.
Fysiska tabeller
Det här alternativet utför kopplingar då frågan körs och kan potentiellt förbättra prestanda och minska extraktfilens storlek, förutsatt att dina data uppfyller samtliga av följande villkor:
- Alla kopplingar mellan fysiska tabeller är likvärdiga (=) kopplingar.
- Datatyperna för de kolumner som används för relationer eller kopplingar är identiska.
- Inga genomflödesfunktioner (RAWSQL) används.
- Ingen inkrementell uppdatering har konfigurerats.
- Inga extraktfilter har konfigurerats.
- Översta N posterna eller sampling har inte konfigurerats.
- Inga data behöver läggas till i extraktet.
Tips för att arbeta med fysiska tabeller
Extrakt som är större än förväntat: För att avgöra om extraktet är större än det borde vara måste summan av rader i extraktet med alternativet Logiska tabeller vara högre än summan av rader i alla de kombinerade tabellerna innan extraktet har skapats. Om du stöter på det här scenariot kan du försöka använda alternativet Fysiska tabeller istället.
Filtreringsalternativ: När du använder alternativet Fysiska tabeller inaktiveras andra alternativ för att minska data i ditt extrakt, exempelvis extraktfilter, aggregering, översta N posterna och sampling. Om du behöver minska data i ett extrakt som använder alternativet Fysiska tabeller kan du överväga att filtrera data innan de hämtas till Tableau Desktop med något av följande förslag:
- Alla kopplingar mellan fysiska tabeller är likvärdiga (=) kopplingar.
Anslut till dina data och definiera filter med hjälp av anpassad SQL. Anslut till dina data med hjälp av anpassad SQL i stället för att ansluta till en databastabell. När du skapar din anpassade SQL-fråga, se till att den innehåller lämplig nivå av filtrering som du behöver för att minska data i ditt extrakt. Mer information om anpassad SQL i Tableau Desktop finns i Ansluta till en anpassad SQL-fråga.
Definiera en vy i databasen. Om du har skrivbehörighet till databasen kan du överväga att definiera en databasvy som innehåller precis de data som du behöver för extraktet och därefter ansluta till databasvyn från Tableau Desktop.
Radnivåsäkerhet med extrakt: Om du vill säkra extraktdata på radnivå är alternativet Fysiska tabeller det rekommenderade sättet att uppnå detta scenario. Mer information om radnivåsäkerhet i Tableau finns i Begränsa åtkomst på dataradsnivå.
Filter
Använd filter för att begränsa hur mycket data som extraheras baserat på fälten och deras värden.
Obs! Extraktfilter för logiska tabeller är övergripande (dvs. tillämpas för hela datakällan) för datakällor med en enda bastabell. För datakällor med flera bastabeller med relationer med flera fakta tillämpas extraktfilter per tabell och endast för den logiska tabellen. Mer information om övergripande filter och filter som tillämpas per tabell finns i Filtrera data från datakällor.
Aggregering
Med den här funktionen kan du aggregera mätvärden. Du kan också använda Summera datum på en viss datumnivå, t.ex. år eller månad. Exemplen illustrerar hur data extraheras med de olika tillgängliga aggregeringsalternativen.
- Ursprungliga data: Varje post visas som en separat rad. Det finns sju rader i dessa ursprungliga data.
- Aggregera data för synliga dimensioner (ingen summering): Poster med samma datum och bokstäver har aggregerats på en och samma rad. Det finns fem rader i extraktet.
- Aggregera data för synliga dimensioner (summera datum till månad): Datum har summerats upp till nivån Månad och poster med samma region har aggregerats på en och samma rad. Det finns tre rader i extraktet.
Ursprungliga data | Aggregering utan summering | Aggregering med summering |
![]() | ![]() | ![]() |
Antal rader
Du kan extrahera alla rader eller de översta N raderna. Tableau börjar med att tillämpa eventuella filter och aggregeringar och extraherar sedan antalet rader från det filtrerade och aggregerade resultatet. Alternativet för antal rader beror på vilken typ av datakälla du extraherar från. Du kanske inte ser samplingalternativet i dialogrutan Extrahera data eftersom vissa datakällor inte har stöd för sampling.
Obs! Fält som du döljer först på sidan Datakälla eller på bladfliken tas inte med i extraktet. Klicka på knappen Dölj alla oanvända fält för att ta bort de dolda fälten från extraktet.
De flesta datakällorna stöder inkrementell uppdatering. Istället för att uppdatera hela extraktet kan du konfigurera en uppdatering som bara lägger till de rader som är nya sedan den senaste dataextraktionen.
Du kan till exempel ha en datakälla som uppdateras dagligen med nya försäljningstransaktioner. Istället för att bygga om hela extraktet varje dag lägger du bara till de nya transaktioner som inträffat under dagen.
Tips för inkrementell uppdatering
Inkrementell uppdatering:
- Välj Alla rader under Antal rader.
- Inkrementell uppdatering är inte tillgänglig om du aktiverar Aggregering.
Avancerade inställningar:
- Avancerade inställningar är inte kompatibla med filter.
Extrakttips
Spara arbetsboken för att bevara anslutningen till extraktet
När du har skapat ett extrakt börjar arbetsboken använda extraktversionen av dina data. Anslutningen till extraktversionen av dina data sparas dock inte förrän du sparar arbetsboken. Detta innebär att om du stänger arbetsboken utan att spara arbetsboken först, kommer arbetsboken att ansluta till den ursprungliga datakällan nästa gång du öppnar den.
Växla mellan provdata och hela extraktet
När du arbetar med ett stort extrakt kan det vara bra att skapa ett mindre urval av data. Det gör att du kan ställa in vyn utan att behöva köra långa frågor varje gång du lägger till ett fält i din analys. Du kan enkelt växla mellan att använda urvalsdata och hela datakällan genom att välja lämpligt alternativ i menyn Data.
Anslut inte direkt till extraktet
När du sparar extrakt på din dator kan du ansluta direkt till dem med en ny Tableau Desktop-version. Det rekommenderas dock inte av bland annat följande skäl:
- Tabellerna kan ha olika namn. Extrakt använder särskilda namnkonventioner för att säkerställa att varje tabell har ett unikt namn och de kan vara svåra att förstå.
- Du kan inte uppdatera extraktet. När du ansluter direkt till ett extrakt betraktar Tableau det som den ursprungliga datakällan, snarare än en kopia. Det betyder att du inte kan länka tillbaka det till din ursprungliga datakälla.
- Strukturen och relationerna mellan tabeller kommer att gå förlorade. Arrangemanget och kopplingarna mellan tabeller lagras i .tds-filen, inte i .hyper-filen. Den informationen går därför förlorad när du ansluter direkt till .hyper-filen. Om du använder logisk tabellagring för extraktet kommer du inte att se några referenser till de ursprungliga fysiska tabellerna.
Använd inte ett extrakt om du ansluter till en virtuell anslutning med användarfunktioner i datapolicyn.
Om en virtuell anslutning har en datapolicy som innehåller Användarfunktioner(Länken öppnas i ett nytt fönster) (till exempel USERNAME()
), och du ansluter till den från en arbetsbok eller datakälla och skapar ett extrakt där, så kommer extraktet bara att innehålla de rader som matchar den virtuella anslutningens datapolicy vid den tidpunkt extraktet skapas. Om du vill utnyttja fördelarna med en virtuell anslutning med användarfunktioner i datapolicyn använder du en liveanslutning från arbetsboken eller datakällan till den virtuella anslutningen i stället för ett extrakt.
Ta bort extraktet från arbetsboken
Du kan när som helst ta bort ett extrakt genom att välja extraktdatakällan på menyn Data och sedan välja . När du tar bort ett extrakt kan du välja att endast ta bort extraktet från arbetsboken eller ta bort och ta bort extraktfilen. Det senare alternativet tar bort extraktet från hårddisken.
Visa extrakthistorik (Tableau Desktop)
Du kan se när extraktet senast uppdaterades och andra detaljer genom att välja en datakälla i Data-menyn och sedan .
Om du öppnar en arbetsbok som sparas med ett extrakt och Tableau inte kan hitta extraktet ska du välja ett av följande alternativ när du uppmanas att göra det i dialogrutan Extrakt hittades inte:
- Hitta extraktet: Välj det här alternativet om extraktet finns, men inte på den plats där Tableau ursprungligen sparade det. Klicka på OK för att öppna dialogrutan Öppna fil där du kan ange den nya platsen för extraktfilen.
- Ta bort extraktet: Välj det här alternativet om du inte längre behöver extraktet. Detta motsvarar att stänga datakällan. Alla öppna arbetsblad som refererar till datakällan tas bort.
- Avaktivera extraktet: Använd den ursprungliga datakällan från vilken extraktet skapades istället för extraktet.
- Återskapa extraktet: Återskapar extraktet. Alla filter och andra anpassningar som du angav när du ursprungligen skapade extraktet tillämpas automatiskt.
Felsök extrakt
- Att skapa ett extrakt tar lång tid: Beroende på storleken på din datauppsättning kan det ta lång tid att skapa ett extrakt. När du väl har extraherat data och sparat dessa på datorn kan det hända prestandan förbättras.
- Extrakt skapas inte: Om datauppsättningen innehåller ett stort antal kolumner (till exempel flera tusen) kanske Tableau i vissa fall inte kan skapa extraktet. Om du stöter på problem, överväg då att extrahera färre kolumner eller omstrukturera de underliggande uppgifterna.
- Dialogrutan Spara visas inte eller extraktet har inte skapats från en .twbx: Om du följer den föregående proceduren för att extrahera data från en paketerad arbetsbok visas inte dialogrutan Spara. När ett extrakt skapas från en paketerad arbetsbok (.twbx) lagras extraktfilen automatiskt i paketet med filer som är kopplade till den paketerade arbetsboken. För att komma åt extraktfilen som du skapade från den paketerade arbetsboken måste du packa upp arbetsboken. Mer information finns i Paketerade arbetsböcker.
Uppdateringar av extraktfunktioner
Uppdatering av delintervall för inkrementella extrakt
I Tableau-version 2024.2 och senare kan du ange ytterligare en tidsperiod för att extrahera tidigare extraherade data och fånga upp eventuella ändringar som kan ha inträffat. Mer information finns under Uppdatera extrakt.
Inkrementell uppdatering
Från och med version 2024.1 introducerar Tableau en funktion med vilken användare kan utföra inkrementella uppdateringar av extrakt med hjälp av en icke-unik nyckelkolumn. Det finns ett nytt användargränssnitt som har stöd för de här avancerade inställningarna.
Den här uppdateringen introducerar även ett extra steg i extraheringsprocessen. En inkrementell uppdatering börjar med att de rader, som matchar det tidigare registrerade högsta värdet, tas bort från extraktet. Tableau frågar sedan efter alla rader som har ett värde som är högre än eller lika med det tidigare högsta värdet. Detta säkerställer att alla borttagna rader beaktas liksom alla nyligen tillagda.
Extrakt på webben
Från och med version 2020.4 finns extrakt tillgängliga i webbredigeringen och på innehållsservern. Nu behöver du inte längre använda Tableau Desktop för att extrahera dina datakällor. Mer information finns i Skapa extrakt på webben.
Logiska och fysiska tabellextrakt
I och med införandet av logiska tabeller och fysiska tabeller i Tableau-datamodellens version 2020.2 har lagringsalternativen för extrakt ändrats från enstaka tabeller och flera tabeller till logiska tabeller och fysiska tabeller. Dessa alternativ beskriver bättre hur extrakt kommer att lagras. För mer information, se Extrahera data.
Utfasning av .tde-format
När du skapar ett extrakt används .hyper-formatet. Extrakt i .hyper-format utnyttjar den förbättrade datamotorn, som har stöd för samma snabbare analys- och frågeförmåga för större datauppsättningar. Från och med mars 2023 är extrakt som använder .tde-formatet inaktuella i Tableau Cloud, Tableau Public och Tableau Server (version 2023.1.0). Version 2024.2 är den sista versionen som kan öppna filer i .tde-format. Mer information finns i Extraktuppgradering till .hyper-format.
För att förbättra extrakteffektiviteten och -skalbarheten kan värden i extrakt beräknas annorlunda än vissa datakällor. Ändringar i hur värdena beräknas kan påverka hur markeringar i vyn fylls i. I vissa sällsynta fall kan ändringarna leda till att din vy ändrar form eller blir tom. Dessa ändringar kan också gälla datakällor med flera anslutningar, datakällor som använder liveanslutningar till filbaserade data, datakällor som ansluter till Google Sheets-data, molnbaserade datakällor, extraheringsexklusiva datakällor samt WDC-datakällor.
Format för värden för datum och datum/tid
Extrakt är föremål för konsekventa och strikta regler kring hur datumsträngar tolkas genom funktionerna DATE, DATETIME och DATEPARSE. Detta påverkar hur datum tolkas eller vilka datumformat och mönster som är tillåtna för dessa funktioner. Mer specifikt kan reglerna generaliseras enligt följande:
- Datum utvärderas och tolkas sedan kolumn för kolumn, inte efter rad.
- Datum utvärderas och tolkas sedan baserat på platsen där arbetsboken skapades, inte på platsen för datorn där arbetsboken öppnas.
De här reglerna gör det möjligt att effektivisera extrakten och åstadkomma resultat som är förenliga med kommersiella databaser.
Vanliga orsaker till ändringar av värden för datum och datum/tid
- Om datumet är tvetydigt och kan tolkas på flera olika sätt kommer datumet att tolkas baserat på det format som Tableau har fastställt för den kolumnen. Exempel finns i Scenario 1 nedan.
- När en funktion måste tolka ett ÅÅÅÅ-MM-DD-format (ISO). Ett exempel finns i Scenario 2.
- När en funktion tolkar år tolkas de som följer:
- År ”07” tolkas som ”2007”
- År ”17” tolkas som ”2017”.
- År ”30” tolkas som ”2030”.
- År ”69” tolkas som ”2069”.
- År ”70” tolkas som ”1970”.
Vanliga orsaker till null-värden
- När en funktion måste tolka flera datumformat i en enda kolumn. När Tableau har bestämt datumformatet blir alla andra datum i kolumnen som avviker från formatet null-värden. Exempel finns i Scenario 1 nedan.
- När en funktion måste tolka ett ÅÅÅÅ-MM-DD-format (ISO). Värden som överstiger vad som är tillåtet för ”ÅÅÅÅ”, ”MM” eller ”DD” orsakar null-värden. Ett exempel finns i Scenario 2.
- När en funktion måste tolka datumvärden som innehåller efterföljande tecken. Till exempel tidszon och sommartidssuffix och nyckelord, exempelvis ”midnatt”, orsakar null-värden.
- När en funktion måste tolka ett ogiltigt datum eller en ogiltig tid. Till exempel orsakar 32/3/2024 ett null-värde. I ett annat exempel orsakar 25:01:61 ett null-värde.
- När en funktion måste tolka motsatta inmatningar. Anta till exempel att mönstret är ”dd.MM (MMMM) y” och inmatningssträngen är ”1.09 (augusti) 2024”, där både ”9” och ”augusti” är månader. Resultatet är ett null-värde eftersom månadens värden inte är desamma.
- När en funktion måste tolka motsatta mönster. Till exempel kommer ett mönster som anger en blandning av gregorianska år (y) och ISO-vecka (ww) att orsaka null-värden.
Scenario 1
Anta att du har en arbetsbok skapad på en engelskspråkig plats som använder extraktdatakällan .tde. I tabellen nedan visas en kolumn med strängdata som finns i extraktdatakällan.
10/31/2024 |
31/10/2024 |
12/10/2024 |
Baserat på den aktuella engelskspråkiga platsen fastställdes det att formatet på datumkolumnen följer formatet MDÅ (månad, dag, år). Följande tabeller visar vad Tableau visar baserat på denna plats när funktionen DATUM används för att konvertera strängvärden till datumvärden.
October 31, 2024 |
October 31, 2024 |
December 10, 2024 |
Om extraktet öppnas på en tyskspråkig plats ser du följande:
31 Oktober 2024 |
31 Oktober 2024 |
12 Oktober 2024 |
Efter att extraktet har öppnats på en tyskspråkig plats med version 10.5 och senare tillämpas DMÅ-formatet (dag, månad och år) för den tyskspråkiga platsen strikt och orsakar ett null-värde eftersom ett av värdena inte följer DMÅ-formatet.
Null |
October 31, 2024 |
October 12, 2024 |
Scenario 2
Anta att du har en kolumn med strängdata som finns i datakällan.
2024-10-31 |
2024-31-10 |
2024-12-10 |
2024-10-12 |
Eftersom datumet använder ISO-formatet följer datumkolumnen alltid formatet ÅÅÅÅ-MM-DD. Följande tabeller visar vad Tableau visar när DATUM-funktionen används för att konvertera strängvärden till datumvärden.
October 10, 2024 |
Null |
December 10, 2024 |
October 12, 2024 |
Sorteringsordning och skiftlägeskänslighet
Extrakt har sammanställningsstöd och kan därför på ett lämpligare sätt sortera strängvärden som har accenter eller har formaterats (gemener/versaler) på ett annat sätt.
Anta till exempel att du har en tabell med strängvärden. När det gäller sorteringsordning innebär detta att ett strängvärde som ”Égypte” nu listas på lämpligt sätt efter ”Estonie” och före ”Fidji”.
När det gäller formatering av gemener/versaler betraktas samma strängvärden som unika och lagras därför som enskilda värden.
Avgörande i översta n-frågor
En översta N-fråga i ditt extrakt kan producera dubbletter av värden för en specifik position i en rankning. Anta till exempel att du skapar ett topp 3-filter. Positionerna 3, 4 och 5 har samma värden. Det övre filtret returnerar 1, 2 och 5 positioner.
Precision för flyttalsvärden
Extrakt är bättre på att dra nytta av tillgängliga hårdvaruresurser på en dator och kan därför utföra matematiska operationer på ett mycket parallellt sätt. På grund av detta kan reella tal aggregeras med .hyper-extrakt i olika ordning. När tal aggregeras i olika ordning kan du komma att se olika värden i vyn efter decimaltecknet varje gång aggregeringen beräknas. Detta beror på att flyttalsaddition och multiplikation inte nödvändigtvis är associativa. Det vill säga att (a + b) + c inte nödvändigtvis är detsamma som a + (b + c). Dessutom kan reella tal aggregeras i olika ordning eftersom flyttalsmultiplikation inte nödvändigtvis är distributiv. Det vill säga att (a x b) x c inte nödvändigtvis är detsamma som a x b x c. Den här typen av avrundningsbeteende med flyttal i .hyper-extrakt liknar den typ av avrundningsbeteende med flyttal som förekommer i kommersiella databaser.
Anta till exempel att arbetsboken innehåller ett skjutreglagefilter på ett aggregerat fält som består av flyttalsvärden. Eftersom precisionen för flyttalsvärden har ändrats kan filtret nu utesluta en markering som definierar den övre eller nedre gränsen för filterintervallet. Avsaknaden av dessa värden kan orsaka en tom vy. För att lösa detta problem, flytta reglaget på filtret eller ta bort och lägg till filtret igen.
Aggregeringarnas noggrannhet
Extrakt optimerar för stora datauppsättningar genom att bättre utnyttja tillgängliga hårdvaruresurser på en dator och därmed kunna beräkna aggregeringar på ett mycket parallellt sätt. På grund av detta kan aggregeringar som utförs av .hyper-extrakt likna resultaten från kommersiella databaser mer än resultaten från programvara som specialiserat sig på statistiska beräkningar. Om du arbetar med en liten datauppsättning eller behöver en högre noggrannhetsnivå kan du överväga att utföra aggregeringar via referenslinjer, sammanfattande kortstatistik eller tabellberäkningsfunktioner såsom varians, standardavvikelse, korrelation eller kovarians.
Du kan använda extrakt-API:et för att skapa .hyper-extrakt. För uppgifter som extraktpublicering kan du använda Tableau Server REST API eller biblioteket för Tableau Server-klienten (Python). För uppdateringsuppgifter kan du även använda Tableau Server REST API. Mer information finns i Tableau Hyper-API.