Konfigurera din datauppsättning

Obs! Från och med version 2020.4.1 kan du nu skapa och redigera flöden i Tableau Server och Tableau Cloud. Innehållet i det här avsnittet gäller alla plattformar, såvida inget annat anges. Mer information om hur du redigerar flöden på webben finns i Tableau Prep på webben i hjälpen för Tableau Server(Länken öppnas i ett nytt fönster) och Tableau Cloud(Länken öppnas i ett nytt fönster).

Du kan ange hur stor del av en datauppsättning du vill jobba med i flödet genom att konfigurera datauppsättningen. När du ansluter till data eller drar tabeller till rutan Flöde läggs ett inmatningssteg automatiskt till för flödet.

I inmatningssteget kan du bestämma vilka och hur mycket data som ska inkluderas i ditt flöde. Det här är alltid det första steget i flödet.

Om du är ansluten till en Excel- eller textfil kan du även uppdatera data från inmatningssteget. Mer information finns i Lägga till mer data i inmatningssteget(Länken öppnas i ett nytt fönster).

I inmatningssteget kan du:

  • Högerklicka eller Cmd-klicka (MacOS) på inmatningssteget i rutan Flöde om du vill byta namn på det eller ta bort det.
  • Förena flera filer i samma överordnade eller underordnade katalog. Mer information finns i Förena filer och databastabeller i steget Indata.
  • (Version 2023.1 och senare) Inkludera automatiskt genererade radnummer baserat på den ursprungliga sorteringsordningen för datauppsättningen. Mer information finns i Inkludera radnummer från en datauppsättning.
  • Söka efter fält.
  • Se en förhandsgranskning av fältvärden.
  • Konfigurera fältegenskaperna genom att ändra fältnamnet eller genom att konfigurera textinställningarna för textfiler.

    Obs! Om ett fältvärde innehåller hakparenteser så konverteras de automatiskt till parenteser.

  • Konfigurera det dataurval som hämtas in till flödet. Läs mer i Konfigurera storleken på dataurvalet.
  • Ta bort fält som inte behövs. Du kan alltid gå tillbaka till inmatningssteget och inkludera dem senare.
  • Dölj fält som inte behöver rensas, men som du ändå vill inkludera i flödet. Du kan visa dem igen när som helst om de behövs.
  • Tillämpa filter på valda fält. 
  • Ändra fältdatatypen för dataanslutningar som har stöd för det.
  • (version 2023.3 och senare) Du kan ställa in rubriken och startraden för CSV-filer.
  • (version 2024.1 och senare) Du kan ställa in rubriken och startraden för Excel-filer.

Inkludera radnummer från en datauppsättning

Stöds i Tableau Prep Builder version 2023.1 och senare och på webben för Microsoft Excel-filer och textfiler (.csv).

Obs! Det här alternativet stöds för närvarande inte för filer som ingår i en inmatningsförening.

Från och med version 2023.1 genererar Tableau Prep automatiskt radnummer baserat på den ursprungliga sorteringsordningen för data som du kan inkludera som ett nytt fält i flödet. Detta är bara tillgängligt för Microsoft Excel-filer och textfiler (.csv).

Om du i tidigare versioner ville inkludera de här radnumren var du tvungen att lägga till dem manuellt i källan innan du lade till datauppsättningen i flödet.

Det här fältet genereras i inmatningssteget när du ansluter till dina data. Som standard utesluts det från flödet, men du kan inkludera det med ett klick. Om du väljer att inkludera det fungerar det som vilket annat fält som helst, och du kan använda det i flödesåtgärder och beräknade fält.

Tableau Prep har också stöd för funktionen ROW_NUMBER för beräknade fält. Den här funktionen är användbar när det finns fält i datauppsättningen som kan definiera sorteringen, till exempel rad-ID eller tidsstämpel. Mer information om hur du använder den här funktionen finns i Skapa beräkningar för detaljnivå, rankning och sektioner.

Lägga till fältet Radnummer i källan i ett flöde

  1. Högerklicka eller Cmd-klicka (MacOS) på fältet, eller klicka på menyn Fler alternativ och välj Inkludera fält.

    Förhandsgranskning av data:

    Fältlista:

  2. Ändringslistan rensas, fältet ingår nu i flödesdata och du kan se de genererade radnumren i efterföljande flödessteg.

Information om Radnummer i källan

När du inkluderar Radnummer i källan i en datauppsättning gäller följande alternativ och överväganden.

  • Radnummer i datakällan tillämpas före eventuella dataurval och filter.
  • Detta skapar ett nytt fält som kallas Radnummer i källan (Source Row Number) som finns i hela flödet. Det här fältnamnet är inte översatt, men du kan när som helst ändra det.
  • Om det redan finns ett fält med det här namnet läggs ett versionsnummer till i det nya fältnamnet. Till exempel Radnummer i källan-1, Radnummer i källan-2 och så vidare.
  • Du kan ändra fältets datatyp i efterföljande steg.
  • Du kan använda det här fältet i flödesåtgärder och beräkningar.
  • Detta värde återskapas för hela datauppsättningen varje gång indata uppdateras eller flödet körs.
  • Det här fältet är inte tillgängligt för inmatningsföreningar.

Ställa in rubrik och startrad för data

Stöds i Tableau Prep Builder version 2023.3 och senare och på webben för textfiler (.csv) samt i version 2024.1 och senare för Excel-filer (.xls).

Du kan ställa in en specifik rad som rubrikrad för ett fält och identifiera den rad på vilken data startar för Excel- och textfiler (.csv).

När du ansluter till Excel- eller textfiler är det vanligt att filerna har formaterats med metainformation på de första raderna för att göra dem läsbara för människor. Som standard tolkar Tableau Prep de första raderna i CSV-filerna som rubrikraden. Excel-filer tolkas utifrån fälttyper och tomma rader. Tableau Prep kan välja en rad som rubrik eller inte inkludera någon rubrikrad.

I följande fil tolkas till exempel STORE DETAILS som rubrikrad.

Du kan utesluta metadatainformationen (1) och tillhandahålla rätt schemastruktur för data genom att ställa in rad 3 som rubrik (2) och rad 4 som den rad där data börjar.

CSV-filer:

Excel-filer:

Till exempel visar följande standardinställningarna för radrubriken och startraden:

Följande visar data exklusive metadata:

Obs! Förhandsgranskningen av data återspeglar inte ändringar av inställningar för dataurval.

Konfigurera rubriken och startraden

Med vyn för förhandsgranskning av data kan du visuellt inspektera schemastrukturen för data och ställa in rubriker och startrader till att exkludera metadata från indatan.

Alla värden som är högre än rubrikradens värde kan användas som värde på Startrad för data. Som standard anges startraden för data som den nästföljande raden efter rubrikraden i Tableau Prep. Alla rader mellan rubrikraden och startraden för data ignoreras.

Obs! Förhandsgranskning av data och datatolk utesluter varandra. Datatolken upptäcker bara undertabeller i dina Excel-kalkylblad och har inte stöd för att specificera startraden för textfiler och kalkylblad.

  1. Välj indatasteget.
  2. Klicka på Förhandsgranskning av data i verktygsfältet.
  3. På raden som du vill ställa in som rubrik klickar du på menyn Fler alternativ och väljer Ställ in som rubrik.
  4. På raden som du vill ställa in som startrad för data klickar du på menyn Fler alternativ och väljer Ställ in som datastart. Som standard är startraden för data inställd på nästföljande radnummer. 

    Menyn Rubrikalternativ visar rubrikraden och radnumret för datastartraden. Alternativt kan du ställa in rubriken och startraden direkt i dialogrutan Rubrikalternativ.

Flera scheman i en enda fil

Om en enskild fil innehåller flera datakällor kan du skapa ett extra inmatningssteg genom att ansluta till samma datakälla och sedan ställa in rubrik och startrad för data för den andra datakällan. Exempelvis innehåller följande fil en datakälla som börjar på rad nummer 3 (1) med ett annat, separat andra schema som startar på rad nummer 28 (2).

Följ de här stegen för den här typen av datakälla.

  1. Välj det första inmatningssteget.
  2. Klicka på Förhandsgranskning av data i verktygsfältet.
  3. På raden som du vill ställa in som rubrik klickar du på menyn Fler alternativ och väljer Ställ in som rubrik.
  4. På raden som du vill ställa in som startrad för data klickar du på Fler alternativ och väljer Ställ in som datastart. Som standard är startraden för data inställd på nästföljande radnummer.
  5. Välj nästa inmatningssteg.
  6. Upprepa stegen ovan för att ställa in rubriken och startraden för ytterligare datakällor.

    Alla rader mellan rubrikraden och startraden för data ignoreras.

Förena flera tabeller

Stöds i Tableau Prep Builder version 2024.1 och senare och på webben för textfiler (.csv).

Du kan förena flera tabeller från datakällor som har samma schemastruktur och metadatarad.

  1. Anslut till filerna och välj det första inmatningssteget.
  2. Klicka på Förhandsgranskning av data i verktygsfältet.
  3. På raden som du vill ställa in som rubrik klickar du på Fler alternativ och väljer Ställ in som rubrik.
  4. På raden som du vill ställa in som startrad för data klickar du på Fler alternativ och väljer Ställ in som datastart.
  5. Klicka på fliken Tabeller och välj Förena flera tabeller.
  6. Klicka på Tillämpa för att förena filerna och behålla rubriken och radvalet för alla filer i inmatningsföreningen. Detta förutsätter att filstrukturen och schemat för de förenade filerna i inmatningen är desamma.

Ansluta till en anpassad SQL-fråga

Om din databas har stöd för anpassad SQL visas Anpassad SQL längst ned i rutan Anslutningar. Öppna fliken Anpassad SQL genom att dubbelklicka på Anpassad SQL. På den här fliken kan du kapa frågor som väljer ut data i förväg och köra åtgärder som är specifika för källan. När frågan hämtar datauppsättningen kan du välja vilka fält som ska tas med, tillämpa filter eller ändra datatypen innan du lägger till data i flödet.

Mer information om hur du använder anpassad SQL finns i Använda anpassad SQL för att ansluta till data.

Tillämpa rensningsåtgärder i ett inmatningssteg

Endast vissa rensningsåtgärder är tillgängliga i ett inmatningssteg. Du kan göra följande ändringar i listan för inmatningsfältet. Dina ändringar spåras i rutan Ändringar och kommentarer läggs till i vänster i inmatningssteget i rutan Flöde och i inmatningsfältets lista.

  • Dölj fält: Dölj fält i stället för att ta bort dem. Detta gör flödet mer lättöverskådligt. Du kan alltid visa dem igen om du behöver dem. Dolda fält inkluderas fortfarande i utdata när du kör flödet.
  • Filtrera: Använd beräkningsredigeraren för att filtrera värden. Från och med version 2023.1 kan du också använda dialogrutan Filter för relativa datum för att snabbt ange datumintervall för alla fält av typen datum samt typen datum och tid.
  • Byta namn på fält: Dubbelklicka eller Ctrl-klicka (MacOS) på fältnamnet i fältet Fältnamn och ange ett nytt fältnamn.
  • Ändra datatyp: Klicka på datatypen för fältet och välj en annan datatyp på menyn. Det här alternativet stöds för närvarande för Microsoft Excel, text- och PDF-filer, Box-, Dropbox-, Google Drive- och OneDrive-datakällor. Alla andra datakällor kan ändras i ett rensningssteg.

Välja vilka fält som ska ingå i flödet

Obs! Från och med version 2023.1 kan du välja att dölja, visa, ta bort eller inkludera flera fält. I tidigare versioner kan du arbeta med ett fält i taget och markera eller avmarkera kryssrutorna för att inkludera eller ta bort fält.

I rutan Indata visas en lista med fält i datauppsättningen. Som standard inkluderas alla fält utom det automatiskt genererade fältet Radnummer i källan. Använd antingen förhandsgranskning av data eller listvyn för att hantera fälten.

  • Söka: Hitta fält.
  • Dölja fält: Dölj fält som du vill inkludera i flödet, men som inte behöver rensas.
    • Klicka på ögat i fältlistan eller välj Dölj fält från menyn Fler alternativ.
    • I Förhandsgranskning av data väljer du Dölj fält från meynyn Fler alternativ.

    Fälten bearbetas av flödet vid körning. Du kan också visa (Ta fram) dem igen när som helst om du behöver dem. Du hittar mer information i Dölja fält(Länken öppnas i ett nytt fönster).

  • Inkludera fält: Dölj fält som du vill inkludera i flödet, men som inte behöver rensas.
    • I fältlistan väljer du en eller flera rader och högerklickar, Cmd-klickar (MacOS), eller klickar på menyn Fler alternativ och väljer Inkludera fält om du vill lägga till fält som markerats som borttagna igen.
    • I Förhandsgranskning av data klickar du på menyn Fler alternativ på fältet du vill inkludera och väljer Inkludera fält.
  • Ta bort fält:
    • I fältlistan väljer du en eller flera rader och högerklickar, Cmd-klickar (MacOS), klickar på X eller på menyn Fler alternativ och väljer Ta bort fält om du vill ta bort fält som inte ska inkluderas i flödet.
    • I Förhandsgranskning av data klickar du på menyn Fler alternativ på fältet som du vill ta bort och väljer Ta bort fält.

Tillämpa filter på fält i inmatningssteget

Använd filter i indatasteget för att minska mängden data som du hämtar in från datakällorna. Du får bättre effektivitet och ett mer användbart dataurval genom att utesluta data som du inte vill bearbeta när du kör flödet.

I indatasteget kan du använda filter med hjälp av beräkningsredigeraren. Från och med version 2023.1 kan du också använda dialogrutan Filter för relativa datum för att ange ett exakt datumintervall med värden som ska inkluderas för fält av typen datum samt typen datum och tid. Du hittar mer information i ”Filter för relativa datum” i Filtrera data(Länken öppnas i ett nytt fönster).

Du kan använda andra filteralternativ i rensningssteget och i andra typer av steg. Mer information finns i Filtrera data(Länken öppnas i ett nytt fönster).

Använda ett beräkningsfilter

  1. Klicka på Filtrera värden i verktygsfältet. Använd någon av följande metoder för att filtrera data:
    • I fältlistan klickar du på Fler alternativ från fältnamnet och väljer Filtrera > Beräkning ….

    • I Förhandsgranskning av data klickar du på menyn Fler alternativ från fältnamnet och väljer Filtrera > Beräkning ….

  2. Ange filtervillkoren i beräkningsredigeraren.

Använda ett filter för relativa datum

  1. Välj ett fält med datatypen Datum eller Datum och tid, och använd någon av följande metoder för att tillämpa ett relativt datumfilter.
    • I fältlistan högerklickar du, Cmd-klickar (MacOS), eller klickar på menyn Fler alternativ från kolumnen Fältnamn och väljer Filtrera > Relativa datum.
    • I Förhandsgranskning av data klickar du på menyn Fler alternativ från fältet och väljer Filtrera > Relativa datum.
  2. I dialogrutan Filter för relativa datum anger du exakt vilka år, kvartal, månader, veckor eller dagar som du vill inkludera i flödet. Du kan också konfigurera ett ankare som är relativt till ett specifikt datum, och du kan även använda null-värden.

    Obs! Som standard sker filtreringen i förhållande till det datum då flödet körs eller förhandsgranskas av användaren.

Ändra fältnamn

Använd någon av följande metoder för att ändra namnet på ett fält.

En kommentar läggs till i fältrutnätet och i rutan Flöde till vänster i inmatningssteget. Dina ändringar spåras också i rutan Ändringar.

  • I fältlistan väljer du ett fält i kolumnen Fältnamn och klickar på Byt namn på fält. Skriv det nya namnet i fältet.
  • I Förhandsgranskning av data väljer du ett fält och klickar på Byt namn på fält. Skriv det nya namnet i fältet.

Ändra datatyper

Stöds för närvarande för Microsoft Excel, text- och PDF-filer, Box-, Dropbox-, Google Drive- och OneDrive-datakällor. Alla andra datakällor kan ändras i ett rensningssteg.

Obs! Du kan bara ändra datatypen för Radnummer i källan (version 2023.1 och senare) i ett rensningssteg eller en annan typ av steg.

Gör följande om du vill ändra datatypen för ett fält:

  1. Klicka på datatypen för fältet.
  2. Välj den nya datatypen på menyn.
    • Förhandsgranskning av data:
    • Fältvy:
  3. Du kan också ändra datatypen för fälten i andra typer av steg i flödet eller tilldela dataroller så att det blir enklare att validera fältvärdena. Mer information om hur du ändrar datatypen eller använder dataroller finns i Granska de datatyper som tilldelats dina data(Länken öppnas i ett nytt fönster) och Använd dataroller för att validera dina data(Länken öppnas i ett nytt fönster).

Konfigurera fältegenskaper

När du arbetar med textfiler visas fliken Inställningar där du kan redigera anslutningen och konfigurera textegenskaper, t.ex. fältavgränsaren för textfiler. Du kan också redigera filanslutningen i rutan Anslutningar eller konfigurera inställningar för inkrementell uppdatering. Mer information om hur du konfigurerar inkrementell uppdatering för ditt flöde finns i Uppdatera flödesdata med inkrementell uppdatering.

När du arbetar med Excel- eller textfiler kan du korrigera felaktigt härledda datatyper innan du ens startar flödet. Du kan alltid ändra datatyper i efterföljande steg i rutan Profil efter att du har startat flödet.

Konfigurera textinställningar i textfiler

Välj bland följande alternativ om du vill ändra inställningarna som används för att parsa textfiler:

  • Första raden innehåller rubrik (standard): Välj det här alternativet om du vill använda den första raden för fältetiketter.

  • Generera fältnamn automatiskt: Välj det här alternativet om du vill att Tableau Prep Builder ska generera fältrubrikerna automatiskt. Namngivningskonventionen för fält följer samma modell som den för Tableau Desktop: F1, F2 och så vidare.

  • Fältavgränsare: Välj ett tecken i listan som ska användas för att avgränsa kolumnerna. Om du vill ange ett anpassat tecken väljer du Annat.

  • Textkvalificerare: Välj det tecken som omger värdena i filen.

  • Teckenuppsättning: Välj den teckenuppsättning som beskriver textfilens kodning.

  • Språkzon: Välj den språkzon som ska användas för att parsa filen. Den här inställningen anger vilken decimal- och tusentalsavgränsare som ska användas.

Konfigurera storleken på dataurvalet

Stratifierat radval stöds i Tableau Prep Builder version 2023.3 och senare.

Tableau Prep fastställer som standard det maximala antalet rader som krävs för att effektivt utforska och förbereda data för att få ett representativt urval av datauppsättningen. Enligt Tableau Preps urvalsalgoritm gäller att ju fler fält som finns i indata, desto färre antal rader tillåts. Det resulterande dataurvalet kan innehålla alla rader du behöver, eller inte, beroende på hur urvalet beräknades och returnerades. Till exempel använder Tableau Prep som standard metoden Snabbval för dataurvalet. Med den här metoden läses de översta raderna in, och om datauppsättningen är stor och data har strukturerats kronologiskt, så kan det hända att de tidigaste data tas med, men att du inte får en fullständig representation av alla data. Om du inte ser de data du förväntade dig kan du ändra inställningarna för dataurvalet och köra frågan igen.

När du skapar eller redigerar flöden med webbredigering är det administratören som konfigurerar det högsta antalet rader som en användare kan välja när stora datauppsättningar används. Mer information finns i Urvalsdata och bearbetningsbegränsningar i hjälpen för Tableau Server(Länken öppnas i ett nytt fönster) och Tableau Cloud(Länken öppnas i ett nytt fönster).

Förbereda data för provtagning

Om du vet att vissa värden inte behövs för analysen tar du bort fälten i inmatningssteget, så att dessa data inte inkluderas när du skapar eller kör flödet.

Om du har en stor datauppsättning som utlöser provtagning så ökar antalet rader som Tableau Prep läser in om du tar bort fält i inmatningssteget. När provtagning inte används minskar datavolymen som Tableau Prep läser in om du tar bort fält i inmatningssteget.

När du har tagit bort onödiga fält och värden från datauppsättningen kan du ändra mängden data som läses in för urvalet eller urvalsmetoden.

Ändra inställningar för dataurval

Genom att använda urvalsdata blir interaktiviteten bättre och flödesredigeringen blir mer effektiv jämfört med om du profilerar alla data och använder ändringar på större datauppsättningar när du arbetar. Alla data används när du kör flödet. Alla ändringar du gör i urvalsdelen gäller för det aktuella flödet.

Om du vill kontrollera data efter rensning och formning kör du flödet och tittar på resultatet i Tableau Desktop.

Obs! Kör hela flödet i stället för att visa urvalet i Tableau Desktop, så att du kan se alla data. Om du ser oväntade eller felaktiga värden som inte fanns i urvalet kan du gå tillbaka till Tableau Prep för att åtgärda detta.

  1. Ta bort onödiga fält och värden från datauppsättningen.
  2. Välj ett inmatningssteg och klicka sedan på fliken Dataurval.

  3. Välj det antal rader som du vill läsa in för dataurval. Det antal rader du väljer påverkar prestanda.

    • Automatiskt: (standard) Läser in data snabbt och beräknar automatiskt antalet rader så att det finns tillräckligt med data för ett urval. Antalet rader som läses in är lika med eller mindre än 393 216.
    • Specificera: Används vanligtvis för att läsa in ett litet antal rader så att du kan förstå datastrukturen och få snabba inläsningstider. Ange ett antal rader som mindre än 1 miljon.

      Obs! I webbredigering är det administratören som konfigurerar det högsta antalet rader som en användare kan välja när stora datauppsättningar används. Som användare kan du välja antalet rader upp till denna gräns.

    • Maximum: Läser in så mycket data som möjligt för radurval som är lika med eller mindre än 1 048 576. Se till att du uppfyller kraven för hög prestanda för stora datauppsättningar.
  4. Välj den metod som ska användas för antalet rader som returneras för urval. Prestanda kan påverkas när Slumpmässig eller Stratifierad väljs.

    Obs! Radval stöds endast om din indatakälla stöder slumpmässigt urval. Om datakällan inte stöder slumpmässigt urval, används standardmetoden Snabbval.

    • Snabbval: (standard) Urvalsdata baseras på prestanda och raderna returneras så snabbt som möjligt. Vissa rader kanske inte inkluderas i urvalet. De rader som används för urvalet kan vara de första N raderna eller raderna som databasen har cachelagrat i minnet från en tidigare fråga. Även om detta nästan alltid är snabbare än slumpmässigt urval, så kan det returnera ett snedvridet urval (exempelvis data för endast ett år i stället för alla år som finns i data, om posterna sorteras kronologiskt).

    • Slumpmässig: Används för att göra ett urval i en stor datauppsättning och returnera en allmän representation av hela urvalet av rader. Tableau Prep returnerar slumpmässiga rader baserat på alla valda rader som läses in. Det här alternativet kan påverka prestanda första gången data hämtas.

    • Stratifierad: Används för att gruppera efter ett visst fält och sedan göra ett dataurval inom varje undergrupp. Tableau Prep returnerar det begärda antalet rader fördelade över det valda fältet för att gruppera så jämnt som möjligt. I vissa fall och baserat på datakällan kan detta resultera i att vissa värden för fältet har fler rader än andra.
  5. Exempel

    Dessa exempel bygger på datauppsättningen Globala indikatorer som ingår i Tableau Prep. Det första urvalet använder Automatiskt för antalet rader och Slumpmässig för urvalsmetoden eller antalet rader som ska returneras för urval.

    Med de här värdena valda så väljs 3 000 rader ut slumpmässigt och används för att representera hela datauppsättningen.

    Det andra urvalet använder Specificera för antalet rader och Stratifierad för urvalsmetoden. Det angivna antalet rader är inställt på värdet 7 och fältet Födelseantal används för gruppering.

    De nya urvalsvärdena visar en enhetlig fördelning av 7 rader med unika värden över alla fält.

Tack för din feedback!Din feedback har skickats in. Tack!