PDF-fil
I den här artikeln beskrivs hur du ansluter Tableau till fildata i .pdf-format och konfigurerar datakällan.
Obs! Tableau stöder inte höger-till-vänster-språk (RTL). Om din PDF innehåller RTL-text kan tecken komma att visas i omvänd ordning i Tableau.
Upprätta anslutningen och skanna dokumentet efter tabeller
När du har öppnat Tableau klickar du på PDF-fil under Anslut.
Välj den fil du vill ansluta till och klicka sedan på Öppna.
I dialogrutan Skanna PDF-fil anger du de sidor i filen som du vill att Tableau ska genomsöka efter tabeller. Du kan välja att söka efter tabeller på alla sidor, på bara en sida eller på ett antal sidor.
Obs! Skanningen räknar den första sidan av filen som sida 1, liknande de flesta PDF-läsare. När du söker efter tabeller anger du det sidnummer som PDF-läsaren visar och inte det sidnummer som kanske används i själva dokumentet, vilket kan starta från sidan 1.
Anta till exempel att du vill använda ”Tabell 1” från bilden nedan. PDF-läsaren visar ett nummer, och .pdf-filen visar ett annat nummer. Om du vill skanna tabellen korrekt anger du det sidnummer som PDF-läsaren visar. I det här exemplet anger du sidan 15.
På sidan Datakälla gör du följande:
(Valfritt) Välj standardnamnet för datakällan längst upp på sidan och ange sedan ett unikt namn för datakällan, som ska användas i Tableau. Till exempel kan du använda en konvention för namngivning av datakälla som gör det lättare för andra användare av datakällan att räkna ut vilken datakälla de ska ansluta till. Standardnamnet genereras automatiskt utifrån filnamnet.
Om din fil innehåller en tabell klickar du på bladets flik för att starta analysen. Annars kan du från den vänstra rutan dra en tabell till arbetsytan och sedan klicka på bladfliken för att starta analysen.
Om tabellerna i den vänstra rutan
Tabeller som identifieras i .pdf-filen får unika namn och visas i den vänstra rutan efter en skanning. Du kan till exempel se ett tabellnamn som ”Sida 1, Tabell 1”. Den första delen av tabellnamnet anger sidan i .pdf-filen som tabellen kom ifrån. Den andra delen av tabellnamnet anger i vilken ordning tabellen identifierades. Om Tableau har identifierat mer än en tabell på en sida kan den andra delen av tabellnamnet ange en av två saker:
- Tableau har identifierat en annan unik tabell eller undertabell på sidan.
- Tableau har tolkat tabellen på sidan på ett annat sätt. Tableau kan ge flera tolkningar av en tabell beroende på hur tabellen presenteras i din .pdf-fil.
Exempel med PDF-fil som datakälla
Följande är ett exempel på en datakälla i form av en PDF-fil.
Hämta mer data
Hämta mer data till datakällan genom att lägga till fler tabeller eller ansluta till data i en annan databas.
Lägg till mer data från den aktuella filen:
Från rutan till vänster drar du ytterligare tabeller till arbetsytan för att kombinera data genom en koppling eller förening. Mer information finns i Koppla dina data eller Förena dina data.
Om sidorna som lästes in i steg 3 i proceduren ovan inte genererar de tabeller som du behöver i den vänstra rutan, klickar du på listrutepilen bredvid PDF-filanslutningen och klickar sedan på Skanna om PDF-fil. Med det här alternativet kan du skapa en ny sökning så att du kan ange olika sidor i .pdf-filen för att söka efter tabeller.
Lägg till mer data från olika databaser: Klicka på Lägg till bredvid Anslutningar i den vänstra rutan. Mer information finns i Koppla dina data.
Om en koppling som du vill ha inte finns i rutan till vänster, väljer du Data > Ny datakälla för att lägga till en ny datakälla. Mer information finns i Kombinera data.
Ange tabellalternativ
Du kan ställa in tabellalternativ. Klicka du på listrutepilen på arbetsytan och ange sedan om datan innehåller fältnamn i den första raden. De här namnen blir i sådant fall fältnamnen i Tableau. Om fältnamn inte är inkluderade, genereras de automatiskt av Tableau. Du kan byta namn på fälten senare.
Använd Datatolken för att rensa data
Om Tableau märker att det kan hjälpa dig att optimera datakällan för analys, uppmanas du att använda Datatolken. Datatolken kan identifiera undertabeller som du kan använda och ta bort unik formatering som kan orsaka problem senare under analysen. Mer information finns i Rensa data i Excel, CSV, PDF och Google Kalkylark med Datatolken.
Förenade tabeller i dina .pdf-filer
Du kan förena tabeller i din fil. Se Förena dina data för mer information om förening.
När du använder jokerteckensökning i förenade tabeller visas resultatet på de sidor som lästes in i den ursprungliga filen som du har anslutit till. Anta till exempel att du har tre filer: A.pdf, B.pdf och C.pdf. Den första fil du ansluter till är A och du begränsar skanningen för tabeller till sidan 1. När du använder jokertecken för att söka i förenade tabeller från filerna B och C kan de ytterligare tabeller som ingår i föreningen endast komma från sidan 1 i B och sidan 1 i C.
Tips för att arbeta med .pdf-filer
Följande tips kan hjälpa dig att arbeta med dina .pdf-filer i Tableau.
Använd PDF-filanslutningen för att endast identifiera tabellerna i din .pdf-fil.
Det primära målet med PDF-filanslutningen är att hitta och identifiera tabeller i din .pdf-fil. Därför ignorerar den all annan information i filen som inte verkar vara en del av en tabell, inklusive rubriker, bildtexter och fotnoter. Om relaterade data lagras i något av dessa områden, till exempel i tabellrubriken, kan du använda Tableau för att först exportera .pdf-fildatan till en .csv-fil, lägga till de data som lagrats i tabellrubriken manuellt och sedan ansluta till .csv-filen istället. Mer information finns i Exportera data till .csv-fil.
Använd standardtabeller.
I allmänhet fungerar Tableau bäst med standardtabeller som använder ett tabellformat.
I idealfallet har tabellerna i din .pdf-fil kolumnrubriker på en enda rad och radvärden på en enda rad, vilket visas i exemplet nedan.
Färger och skuggning som används i eller runt tabellerna kan påverka hur tabellerna identifieras.
Tabeller som har unik formatering kan kräva viss sanering eller manuell redigering utanför Tableau. Unik formatering kan inkludera hierarkiska rubriker, rubriknamn som spänner över flera rader, radvärden som spänner över flera rader, vinkelrubriker och staplade tabeller som visas i exemplen nedan.
Obs! Tableau stöder inte anslutningar till .pdf-filer som genereras av skanningprogramvara (optisk teckenigenkänning).
Validera data.
Se till att du validerar data i tabellerna som Tableau identifierar i din .pdf-fil. Du kan validera data genom att antingen använda datarutnätet eller, om du använde datatolken, resultatarbetsboken.
Undvik tabeller som spänner över flera sidor.
Om din .pdf-fil innehåller en tabell som sträcker sig över flera sidor tolkar Tableau tabellen som flera olika tabeller. För att lösa detta problem, använd en förening för att kombinera tabellerna. Mer information finns i Förena dina data.
Byt namn på .pdf-filer vars filnamn innehåller unicode-tecken.
När du har anslutit till en .pdf-fil som innehåller unicode-tecken i filnamnet kan du komma att se följande fel.
För att lösa problemet byter du namn på filen med hjälp av icke-unicode-tecken och ansluter till din .pdf-fil igen.
Använd inte lösenordsskyddade .pdf-filer.
När du har anslutit till och skannat en .pdf-fil för tabeller kan du se följande fel.
Tableau visar detta fel när din .pdf-fil är lösenordsskyddad och inte kan komma åt dess innehåll. Tableau kan inte stödja anslutningar till lösenordsskyddade .pdf-filer.
Aliasvärden som tolkas annorlunda eller felaktigt.
I datarutnätet kanske du märker att vissa värden tolkas annorlunda än .pdf-filen. Du kan korrigera denna tolkning genom att använda alias för att byta namn på specifika värden i ett fält.
Anta till exempel att du ser följande tabell när du har anslutit till en .pdf-fil. Vissa tillståndsförkortningar tolkas med små bokstäver, vilka markeras med blått.
Du kan lösa detta problem genom att använda alias för att ändra förkortningar med små bokstäver till förkortningar med stora bokstäver. För att göra detta klickar du på listrutan bredvid kolumnnamnet och väljer Alias.
Lös kolumnrubriker som tolkas som tabellvärden.
I datarutnätet kanske du också märker att vissa kolumnrubriker i din .pdf-fil tolkas som tabellvärden istället. Detta kan inträffa om din .pdf-fil innehåller tabeller med unik formatering eller hierarkiska rubriker. I det här scenariot ska du prova datatolken först. Om datatolken inte löser problemet, kan du överväga att manuellt byta namn på kolumnerna till deras lämpliga namn och filtrera rubriknamn som behandlas som värden med hjälp av datakällfilter.
Anta till exempel att du ser följande tabell när du har anslutit till en .pdf-fil. Tabellrubrikerna från .pdf-filen tolkas som tabellvärden och är markerade med blått.
Ett sätt att lösa ett rubrikproblem som detta är att följa steg liknande följande:
Dubbelklicka på kolumnnamnet och byt sedan namn på F1 till År. Upprepa detta steg för F2 till F4 för kol, gas och olja.
Klicka på datatypikonen för kolumnen År och ändra den till en datatyp för tal. Detta gör att de icke-numeriska värdena i den här kolumnen konverteras till nollvärden.
I det övre högra hörnet av datakällan klickar du på Lägg till, klickar på knappen Lägg till och väljer sedan fältet År.
Markera båda kryssrutorna Noll och Uteslut i dialogrutan Filter.
Raderna i kolumnen År som innehåller nollvärden tas bort från datarutnätet, vilket påverkar raderna i de andra kolumnerna i tabellen.
Om .ttde- och .hhyper-filer
Du kanske ser .ttde- eller .hhyper-filer när du navigerar i din dators katalogstruktur. När du skapar en Tableau-datakälla som ansluter till dina data, skapar Tableau även en .ttde- eller .hhyper-fil. Den här filen, som även kallas för ett skuggextrakt, används för att förbättra hastigheten med vilken din datakälla laddas i Tableau Desktop. Även om ett skuggextrakt innehåller underliggande data och annan information som liknar det vanliga Tableau-extraktet sparas det i ett annat format och kan inte användas för att återställa dina data.
Obs! Filer i .tde-format stöds inte längre i Tableau-versioner efter 2024.2. Alla extrakt är nu i .hyper-format.
Se även
- Konfigurera datakällor – Lägg till mer data i den här datakällan eller förbered data innan du analyserar dem.
- Skapa diagram och analysera data – Påbörja dataanalysen.