Konfigurera din datauppsättning
Obs! Från och med version 2020.4.1 kan du nu skapa och redigera flöden i Tableau Server och Tableau Cloud. Innehållet i det här avsnittet gäller alla plattformar, såvida inget annat uttryckligen anges. Mer information om hur du redigerar flöden på webben finns i Tableau Prep på webben i hjälpen för Tableau Server(Länken öppnas i ett nytt fönster) och Tableau Cloud(Länken öppnas i ett nytt fönster).
Du kan ange hur stor del av en datauppsättning du vill jobba med i flödet genom att konfigurera datauppsättningen. När du ansluter till data eller drar tabeller till rutan Flöde läggs ett inmatningssteg automatiskt till för flödet.
I inmatningssteget kan du bestämma vilka och hur mycket data som ska inkluderas i ditt flöde. Det här är alltid det första steget i flödet.
Om du är ansluten till en Excel- eller textfil kan du även uppdatera data från inmatningssteget. Mer information finns i Lägga till mer data i inmatningssteget(Länken öppnas i ett nytt fönster).
I inmatningssteget kan du:
- Högerklicka eller Cmd-klicka (MacOS) på inmatningssteget i rutan Flöde om du vill byta namn på det eller ta bort det.
- Förena flera filer i samma överordnade eller underordnade katalog. Mer information finns i Förena filer och databastabeller i steget Indata.
- (Version 2023.1 och senare) Inkludera automatiskt genererade radnummer baserat på den ursprungliga sorteringsordningen för datauppsättningen. Mer information finns i Inkludera radnummer från en datauppsättning.
- Söka efter fält.
- Se exempel på fältvärden.
Konfigurera fältegenskaperna genom att ändra fältnamnet eller genom att konfigurera textinställningarna för textfiler.
Obs! Om ett fältvärde innehåller hakparenteser så konverteras de automatiskt till parenteser.
- Utför åtgärder för att ändra vilka data du jobbar med i flödet. Se Konfigurera storleken på dataurvalet.
- Konfigurera det dataurval som hämtas in till flödet.
- Ta bort fält som inte behövs. Du kan alltid gå tillbaka till inmatningssteget och inkludera dem senare.
- Dölj fält som inte behöver rensas, men som du ändå vill inkludera i flödet. Du kan visa dem igen när som helst om de behövs.
- Tillämpa filter på valda fält.
Ändra fältdatatypen för dataanslutningar som har stöd för det.
Dessa inkluderar Microsoft Excel-, text- och PDF-filer och data från Box, Dropbox, Google Drive och OneDrive. Om du använder andra datakällor kan du ändra datatypen i ett rensningssteg.
Mer information finns i Granska de datatyper som tilldelats dina data
Inkludera radnummer från en datauppsättning
Stöds i Tableau Prep Builder version 2023.1 och senare och på webben för Microsoft Excel-filer och textfiler (.csv).
Obs! Det här alternativet stöds för närvarande inte för filer som ingår i en inmatningsförening.
Från och med version 2023.1 genererar Tableau Prep automatiskt radnummer baserat på den ursprungliga sorteringsordningen för data som du kan inkludera som ett nytt fält i flödet. Detta är bara tillgängligt för Microsoft Excel-filer och textfiler (.csv).
Om du i tidigare versioner ville inkludera de här radnumren var du tvungen att lägga till dem manuellt i källan innan du lade till datauppsättningen i flödet.
Det här fältet genereras i inmatningssteget när du ansluter till dina data. Som standard utesluts det från flödet, men du kan inkludera det med ett klick. Om du väljer att inkludera det fungerar det som vilket annat fält som helst, och du kan använda det i flödesåtgärder och beräknade fält.
Tableau Prep har också stöd för funktionen ROW_NUMBER för beräknade fält. Den här funktionen är användbar när det finns fält i datauppsättningen som kan definiera sorteringen, till exempel rad-ID eller tidsstämpel. Mer information om hur du använder den här funktionen finns i Skapa beräkningar för detaljnivå, rankning och sektioner.
Lägga till fältet Radnummer i källan i ett flöde
Högerklicka eller Cmd-klicka (MacOS) på fältet, eller klicka på menyn Fler alternativ
och välj Inkludera fält.
Ändringslistan rensas, fältet ingår nu i flödesdata och du kan se de genererade radnumren i efterföljande flödessteg.
Information om Radnummer i källan
När du inkluderar Radnummer i källan i en datauppsättning gäller följande alternativ och överväganden.
- Radnummer i datakällan tillämpas före eventuella dataurval och filter.
- Detta skapar ett nytt fält som kallas Radnummer i källan (Source Row Number) som finns i hela flödet. Det här fältnamnet är inte översatt, men du kan när som helst ändra det.
- Om det redan finns ett fält med det här namnet läggs ett versionsnummer till i det nya fältnamnet. Till exempel Radnummer i källan-1, Radnummer i källan-2 och så vidare.
- Du kan ändra fältets datatyp i efterföljande steg.
- Du kan använda det här fältet i flödesåtgärder och beräkningar.
- Detta värde återskapas för hela datauppsättningen varje gång indata uppdateras eller flödet körs.
- Det här fältet är inte tillgängligt för inmatningsföreningar.
Ansluta till en anpassad SQL-fråga
Om din databas har stöd för anpassad SQL visas Anpassad SQL längst ned i rutan Anslutningar. Öppna fliken Anpassad SQL genom att dubbelklicka på Anpassad SQL. På den här fliken kan du kapa frågor som väljer ut data i förväg och köra åtgärder som är specifika för källan. När frågan hämtar datauppsättningen kan du välja vilka fält som ska tas med, tillämpa filter eller ändra datatypen innan du lägger till data i flödet.
Mer information om hur du använder anpassad SQL finns i Använda anpassad SQL för att ansluta till data.
Tillämpa rensningsåtgärder i ett inmatningssteg
Endast vissa rensningsåtgärder är tillgängliga i ett inmatningssteg. Du kan göra följande ändringar i listan för inmatningsfältet. Dina ändringar spåras i rutan Ändringar och kommentarer läggs till i vänster i inmatningssteget i rutan Flöde och i inmatningsfältets lista.
- Dölj fält: Dölj fält i stället för att ta bort dem. Detta gör flödet mer lättöverskådligt. Du kan alltid visa dem igen om du behöver dem. Dolda fält inkluderas fortfarande i utdata när du kör flödet.
- Filtrera: Använd beräkningsredigeraren för att filtrera värden. Från och med version 2023.1 kan du också använda dialogrutan Filter för relativa datum för att snabbt ange datumintervall för alla fält av typen datum samt typen datum och tid.
Byta namn på fält: Dubbelklicka eller Ctrl-klicka (MacOS) på fältnamnet i fältet Fältnamn och ange ett nytt fältnamn.
Ändra datatyp: Klicka på datatypen för fältet och välj en annan datatyp på menyn. Det här alternativet stöds för närvarande för Microsoft Excel, text- och PDF-filer, Box-, Dropbox-, Google Drive- och OneDrive-datakällor. Alla andra datakällor kan ändras i ett rensningssteg.
Välja vilka fält som ska ingå i flödet
Obs! Från och med version 2023.1 kan du välja att dölja, visa, ta bort eller inkludera flera fält. I tidigare versioner kan du arbeta med ett fält i taget och markera eller avmarkera kryssrutorna för att inkludera eller ta bort fält.
I rutan Indata visas en lista med fält i datauppsättningen. Som standard inkluderas alla fält utom det automatiskt genererade fältet Radnummer i källan. Använd följande alternativ för att hantera fält.
- Sök: Sök efter fält i listan.
- Dölj: Klicka på ögonikonen
eller välj Dölj fält på menyn Fler alternativ
för att dölja fält som du vill inkludera i flödesutdata, men som inte behöver rensas. Fälten bearbetas av flödet vid körning. Du kan också visa (Ta fram) dem igen när som helst om du behöver dem. Du hittar mer information i Dölja fält(Länken öppnas i ett nytt fönster).
- Inkludera fält: Välj en eller flera rader och högerklicka, Cmd-klicka (MacOS) eller klicka på menyn Fler alternativ
och välj Inkludera fält om du vill lägga till fält som markerats som borttagna igen.
- Ta bort fält: Välj en eller flera rader och högerklicka, Cmd-klicka (MacOS), klicka på X eller klicka på menyn Fler alternativ
och välj Ta bort fält om du vill ta bort fält som inte ska inkluderas i flödet.
Tillämpa filter på fält i inmatningssteget
Använd filter i indatasteget för att minska mängden data som du hämtar in från datakällorna. Du får bättre effektivitet och ett mer användbart dataurval genom att utesluta data som du inte vill bearbeta när du kör flödet.
I indatasteget kan du använda filter med hjälp av beräkningsredigeraren. Från och med version 2023.1 kan du också använda dialogrutan Filter för relativa datum för att ange ett exakt datumintervall med värden som ska inkluderas för fält av typen datum samt typen datum och tid. Du hittar mer information i ”Filter för relativa datum” i Filtrera data(Länken öppnas i ett nytt fönster).
Du kan använda andra filteralternativ i rensningssteget och i andra typer av steg. Mer information finns i Filtrera data(Länken öppnas i ett nytt fönster).
Använda ett beräkningsfilter
Klicka på Filtrera värden i verktygsfältet eller klicka på menyn Fler alternativ
i fältrutnätet och välj Filtrera > Beräkning ....
Ange filtervillkoren i beräkningsredigeraren.
Använda ett filter för relativa datum
Välj ett fält med datatypen Datum eller Datum och tid i inmatningsrutnätet. Högerklicka, Cmd-klicka (MacOS) eller klicka på menyn Fler alternativ
och välj Filtrera > Relativa datum.
I dialogrutan Filter för relativa datum anger du exakt vilka år, kvartal, månader, veckor eller dagar som du vill inkludera i flödet. Du kan också konfigurera ett ankare som är relativt till ett specifikt datum, och du kan även använda null-värden.
Obs! Som standard sker filtreringen i förhållande till det datum då flödet körs eller förhandsgranskas av användaren.
Ändra fältnamn
Om du vill ändra namnet på ett fält markerar du namnet i kolumnen Fältnamn och skriver det nya namnet i fältet. En kommentar läggs till i fältrutnätet och i rutan Flöde till vänster i inmatningssteget. Dina ändringar spåras också i rutan Ändringar.
Ändra datatyper
Stöds för närvarande för Microsoft Excel, text- och PDF-filer, Box-, Dropbox-, Google Drive- och OneDrive-datakällor. Alla andra datakällor kan ändras i ett rensningssteg.
Obs! Du kan bara ändra datatypen för Radnummer i källan (version 2023.1 och senare) i ett rensningssteg eller en annan typ av steg.
Gör följande om du vill ändra datatypen för ett fält:
Klicka på datatypen för fältet.
Välj den nya datatypen på menyn.
Du kan också ändra datatypen för fälten i andra typer av steg i flödet eller tilldela dataroller så att det blir enklare att validera fältvärdena. Mer information om hur du ändrar datatypen eller använder dataroller finns i Granska de datatyper som tilldelats dina data(Länken öppnas i ett nytt fönster) och Använd dataroller för att validera dina data(Länken öppnas i ett nytt fönster).
Konfigurera fältegenskaper
När du arbetar med textfiler visas fliken Inställningar där du kan redigera anslutningen och konfigurera textegenskaper, t.ex. fältavgränsaren för textfiler. Du kan också redigera filanslutningen i rutan Anslutningar eller konfigurera inställningar för inkrementell uppdatering. Mer information om hur du konfigurerar inkrementell uppdatering för ditt flöde finns i Uppdatera flödesdata med inkrementell uppdatering.
När du arbetar med Excel- eller textfiler kan du korrigera felaktigt härledda datatyper innan du ens startar flödet. Du kan alltid ändra datatyper i efterföljande steg i rutan Profil efter att du har startat flödet.
Konfigurera textinställningar i textfiler
Välj bland följande alternativ om du vill ändra inställningarna som används för att parsa textfiler:
Första raden innehåller rubrik (standard): Välj det här alternativet om du vill använda den första raden för fältetiketter.
Generera fältnamn automatiskt: Välj det här alternativet om du vill att Tableau Prep Builder ska generera fältrubrikerna automatiskt. Namngivningskonventionen för fält följer samma modell som den för Tableau Desktop: F1, F2 och så vidare.
Fältavgränsare: Välj ett tecken i listan som ska användas för att avgränsa kolumnerna. Om du vill ange ett anpassat tecken väljer du Annat.
Textkvalificerare: Välj det tecken som omger värdena i filen.
Teckenuppsättning: Välj den teckenuppsättning som beskriver textfilens kodning.
Språkzon: Välj den språkzon som ska användas för att parsa filen. Den här inställningen anger vilken decimal- och tusentalsavgränsare som ska användas.
Konfigurera storleken på dataurvalet
För att leverera bästa prestanda begränsar Tableau Prep som standard mängden data som tas med i flödet till ett representativt urval av dina data. Dataurvalet baseras på beräkningen av det optimala antalet rader i relation till det totala antalet fält i datauppsättningen och datatyperna för dessa fält. Tableau Prep hämtar sedan det översta antalet rader för den beräknade mängden så snabbt som möjligt.
Det resulterande dataurvalet kan innehålla alla rader som du behöver, eller inte, beroende på hur urvalet beräknades och returnerades. Om du inte ser de data du förväntade dig kan du ändra inställningarna för dataurvalet och köra frågan igen.
När du skapar eller redigerar flöden på webben är mängden data som du kan ta med i ett flöde begränsad och alternativen som är tillgängliga för att ändra dataurvalet skiljer sig något jämfört med när du arbetar i Tableau Prep Builder. Mer information finns i Urvalsdata och bearbetningsbegränsningar i hjälpen för Tableau Server(Länken öppnas i ett nytt fönster) och Tableau Cloud(Länken öppnas i ett nytt fönster).
Obs! Om ett urval har gjorts från dina data visas en urvalsbricka () i rutan Profil, som finns kvar i alla steg som du lägger till. Om du gör ändringar tillämpas de på det urval som du arbetar med i flödet. Alla ändringar tillämpas på hela datauppsättningen när du kör flödet.
Om du vill ändra inställningarna för dataurvalet väljer du ett inmatningssteg och väljer något av följande alternativ på fliken Dataurval:
(2023.1 – Automatiskt) (2022.4 och tidigare – Standardmängd för urval): Tableau Prep beräknar det totala antalet rader som ska returneras. Detta är standardvalet.
(2023.1 – Maximum) (2022.4 och tidigare – Använd alla data): (endast Tableau Prep Builder) Hämta alla rader i datauppsättningen oavsett storlek. Detta kan påverka prestandan eller göra att Tableau Prep Builder returnerar ett timeout-fel.
Obs! För att upprätthålla prestandan begränsas urvalet till en miljon rader när du använder steg av typen Aggregera och Förena och till tre miljoner rader när du använder steg av typen Koppla och Pivotera.
(2023.1 – Ange) (2022.4 och tidigare – Fast antal rader): Välj hur många rader som ska returneras från datauppsättningen. Rekommenderat antal rader är en miljon eller mindre. Om du anger fler rader än en miljon kan det påverka prestandan.
- In Web authoring (I Webbredigering): Det högsta antalet rader som en användare kan välja när stora datauppsättningar används konfigureras av administratören. Som användare kan du välja antalet rader upp till denna gräns.
Quick select (Snabbval) (standard): Databasen returnerar antalet begärda rader så fort som möjligt. Detta kan vara de första N raderna eller raderna som databasen har cachelagrat i minnet från en tidigare fråga.
Random sample (Slumpurval): Databasen returnerar antalet begärda rader men tittar på alla rader i datauppsättningen och returnerar ett representativt urval från alla raderna. Det här alternativet kan påverka prestandan första gången data hämtas.