Aan de slag met Tableau Prep Builder
Opmerking: vanaf versie 2020.4.1 kunt u als Creator ook flows op het web maken en bewerken. Deze tutorial is ontworpen met Tableau Prep Builder, maar kan ook online worden uitgevoerd, met enkele uitzonderingen.
In deze tutorial maakt u kennis met de algemene bewerkingen die beschikbaar zijn in Tableau Prep. Met behulp van de voorbeeld datasets die bij Tableau Prep worden geleverd, leert u hoe u een flow voor Sample Superstore maakt. In deze tutorial wordt de meest recente versie van Tableau Prep Builder gebruikt. Als u een eerdere versie gebruikt, kunnen uw resultaten afwijken.
Houd de tips in de gaten die inzicht geven in hoe u met Tableau Prep uw data kunt opschonen en vormgeven voor analyse.
Zie Tableau Desktop of Tableau Prep Builder installeren vanuit de gebruikersinterface(Link wordt in een nieuw venster geopend) in de Implementatie Tableau Desktop en Tableau Prep Builder om Tableau Prep Builder te installeren voordat u verder gaat met deze tutorial. Anders kunt u de gratis proefversie(Link wordt in een nieuw venster geopend) downloaden.
Voorbeeld bestanden
Om de taken in deze tutorial te voltooien, moet u Tableau Prep Builder installeren. Als webauthoring is ingeschakeld op uw serverversie 2020.4 of later, kunt u ook de stappen op internet proberen.
Nadat u Tableau Prep Builder op uw computer hebt geïnstalleerd, kunt u de voorbeeld bestanden ook op de volgende locatie vinden:
- (Windows)
C:\Program Files\Tableau\Tableau Prep Builder <version>\help\Samples\en_US\Superstore Files
- (Mac)
/Applications/Tableau Prep Builder <version>.app/Contents/help/Samples/en_US/Superstore Files
U kunt de voorbeeld bestanden ook downloaden via deze links en een directory 'Samples' en een subdirectory 'South' aanmaken. Dit is vereist als u deze tutorial op internet volgt.
Downloaden naar de Samples-directory | Downloaden naar South Sub-directory |
---|---|
Dit is het verhaal ...
U werkt op het hoofdkantoor van een grote winkelketen. Uw baas wil de productverkopen en winsten van het bedrijf over de afgelopen vier jaar analyseren. U stelt voor dat uw baas daarvoor Tableau Desktop gebruikt. Uw baas vindt dit een geweldig idee en wil dat u er meteen mee aan de slag gaat.
Terwijl u alle benodigde data verzamelt, merkt u dat de data voor elke regio op een andere manier zijn verzameld en bijgehouden. U ziet ook dat er veel creatieve data worden ingevoerd in de verschillende bestanden. Er is zelfs een regio die voor elk jaar een apart bestand heeft!
Voordat u kunt beginnen met het analyseren van de data in Tableau, moet u eerst de data grondig opschonen. Dat wordt een lange nacht.
Terwijl u door de menu's van restaurants bladert om een maaltijd te bestellen, herinnert u zich dat Tableau een product bevat met de naam Tableau Prep. Dit kan u helpen bij uw enorme taken op het gebied van data opschonen.
U downloadt het product of meldt zich aan voor een gratis proefperiode(Link wordt in een nieuw venster geopend) en besluit het eens te proberen.
1. Verbinding maken met data
Het eerste wat u ziet wanneer u Tableau Prep Builder opent, is een startpagina met een deelvenster Verbindingen, net als Tableau Desktop.
Om te beginnen, moet u eerst verbinding maken met uw data en een invoerstap maken. Vervolgens bouwt u een workflow of 'flow', zoals deze in Tableau Prep wordt genoemd. Daarna voegt u meer stappen toe om gaandeweg actie te ondernemen voor uw data.
Tip: de invoerstap is het opnamepunt voor uw data en het startpunt voor uw flow. U kunt meerdere invoerstappen hebben en sommige kunnen meerdere databestanden bevatten. Zie Verbinding maken met data(Link wordt in een nieuw venster geopend) voor meer informatie over verbinding maken met data.
Uw verkoopdatabestanden voor de verschillende regio's worden in verschillende opmaken opgeslagen en uw South-bestellingen bestaan feitelijk uit meerdere bestanden. U bekijkt het deelvenster Verbindingen en ziet dat u veel keuzes hebt om verbinding te maken met data. Top!
Omdat uw andere regio's één bestand hebben voor alle vier jaren aan data, besluit u om eerst de South-bestanden aan te pakken.
Klik in het deelvenster Verbindingen op de knop Verbinding toevoegen .
Bij webauthoring klikt u op de Startpagina op Maken > Flow. Of klik op de pagina Verkennen op Nieuw > Flow. Klik vervolgens op Verbinding maken met data.
De bestanden zijn .csv-bestanden, dus selecteer Tekstbestand in de lijst met verbindingen.
Ga naar de directory met uw bestanden. Selecteer in de subdirectory Orders South het eerste bestand orders_south_2015.csv en klik op Open om dit aan uw flow toe te voegen. (Zie Samenvatting en bronnen voor de bestandslocatie.)
Nadat u verbinding hebt gemaakt met uw eerste bestand, wordt de werkruimte Tableau Prep Builder geopend. Deze is verdeeld in twee hoofdsecties. Het deelvenster Flow bovenaan en het deelvenster Invoeren onderaan.
Net als Tableau Desktop is dit deelvenster Flow uw werkruimte, waar u visueel met uw data kunt werken en uw flow kunt opbouwen. Het deelvenster Invoeren bevat configuratie-opties voor hoe de data worden opgenomen. U ziet ook de velden, datatypen en voorbeelden van de waarden uit uw dataset.
In het volgende gedeelte kijken we hoe u met deze data kunt communiceren.
Tip: voor enkele tabellen maakt Tableau Prep automatisch een invoerstap voor u aan in het deelvenster Flow wanneer u data aan uw flow toevoegt. Anders kunt u slepen en neerzetten gebruiken om tabellen toe te voegen aan het deelvenster Flow.
U hebt nog drie andere bestanden voor uw bestellingen in South. Hoe u deze combineert, hangt af van waar u werkt.
In Tableau Prep Builder:
- U kunt elk bestand afzonderlijk toevoegen. Maar u wilt alle bestanden samenvoegen tot één invoerstap, dus klikt u op het tabblad Tabellen in het deelvenster Invoeren.
U ziet een optie voor Meerdere tabellen verenigen. Selecteer deze optie.
U merkt dat de directory waarin u uw bestand hebt geselecteerd, al is ingevuld. De andere bestanden die u nodig hebt, staan in de sectie Opgenomen bestanden in het deelvenster Invoeren.
Tip: het gebruik van Met jokerteken verenigen is een geweldige manier om verbinding te maken met en meerdere bestanden uit één databron met een vergelijkbare naam en structuur te combineren. Om deze optie te kunnen gebruiken, moeten de bestanden zich in dezelfde boven- of onderliggende directory bevinden. Als u niet meteen de bestanden ziet die u nodig hebt, wijzig dan uw zoekcriteria. Zie Verenigingsbestanden en databasetabellen in de invoerstap(Link wordt in een nieuw venster geopend) voor meer informatie.
Klik op Toepassen om de data uit deze bestanden toe te voegen aan de invoerstap orders_south_2015.
De bestanden voor de andere regio's zijn allemaal enkelvoudige tabelbestanden. Zo kunt u alle bestanden in één keer selecteren en aan uw flow toevoegen.
Opmerking: op het web kunnen bestanden alleen afzonderlijk worden geüpload.
In Tableau Server of Tableau Cloud:
De optie Jokerteken is momenteel niet beschikbaar voor Tableau Server of Tableau Cloud. Toch wilt u alle South-bestanden opnemen en de data op dezelfde manier verwerken. In dat geval is het zinvol om ze te combineren.
- Herhaal stappen 2 en 3 om de rest van de bestanden uit de subdirectory Orders South toe te voegen.
- Combineer ze met een stap voor Vereniging. (Zie Verenigingsbestanden en databasetabellen in de invoerstap(Link wordt in een nieuw venster geopend) voor meer details.)
Sleep Orders_South_2016 bovenop Orders_south_2015 en zet neer op de optie Vereniging.
Sleep Orders_South_2017 bovenop de nieuwe stap Vereniging en zet deze neer op Toevoegen. Herhaal deze stap met het uiteindelijke bestand.
Voeg de overige bestanden toe.
In Tableau Prep Builder:
- Open Bestandsverkenner of Finder en ga naar de directory met de bestanden. Ctrl-klik of Cmd+klik (MacOS) om de volgende bestanden te selecteren. Sleep ze naar de directory en zet ze neer in het deelvenster Flow om ze aan uw flow toe te voegen. (Zie Samenvatting en bronnen voor de bestandslocatie.)
- Orders_Central.csv
- Orders_East.xlsx
- Orders_West.csv
Opmerking: dit zijn verschillende bestandstypen. Als u niet al deze bestanden ziet, controleer dan of uw bestandsverkenner of Finder is ingesteld om alle bestandstypen te bekijken.
In Tableau Server of Tableau Cloud:
- Volg stappen 2 en 3 om Orders_Central.csv en Orders_West.csv toe te voegen.
- Klik in het deelvenster Verbindingen op de knop Verbinding toevoegen . Klik op Microsoft Excel en selecteer Orders_East.xlsx.
- Open Bestandsverkenner of Finder en ga naar de directory met de bestanden. Ctrl-klik of Cmd+klik (MacOS) om de volgende bestanden te selecteren. Sleep ze naar de directory en zet ze neer in het deelvenster Flow om ze aan uw flow toe te voegen. (Zie Samenvatting en bronnen voor de bestandslocatie.)
Controleer uw werk: bekijk hoe 'Verbinding maken met data' werkt.
Klik op de afbeelding om deze opnieuw af te spelen
2. Uw data verkennen
Nu u de databestanden in Tableau Prep hebt geladen, weet u zeker dat u alle bestanden wilt combineren. Maar voordat u dat doet, is het misschien een goed idee om ze eerst te bekijken om te controleren of u problemen ziet.
Wanneer u een Invoerstap selecteert in het deelvenster Flow, ziet u de instellingen die zijn gebruikt om de data binnen te halen, de velden die zijn opgenomen en een voorbeeld van uw waarden.
Dit is een goede plek om te beslissen hoeveel data u in uw flow wilt opnemen en om velden die u niet wilt gebruiken, te verwijderen of te filteren. U kunt ook datatypen wijzigen die verkeerd zijn toegewezen.
Tip: als u met grote datasets werkt, haalt Tableau Prep automatisch een voorbeeld van de data op om de prestaties te maximaliseren. Als u de verwachte data niet ziet, moet u de steekproef mogelijk aanpassen. Dit kunt u doen op het tabblad Datasteekproef. Zie Het formaat van uw datasteekproef instellen(Link wordt in een nieuw venster geopend) voor meer informatie over het configureren van uw data-opties en de steekproefomvang.
U ziet in het deelvenster Flow , terwijl u elke stap selecteert en elke dataset bekijkt, een paar zaken die u later wilt oplossen en één zaak die u nu kunt oplossen in de stap Invoeren.
Selecteer de invoerstap Orders_West.
Het veld Staat gebruikt afkortingen voor de naam van de staat. In andere bestanden staat dit ook vermeld, dus dat moet u later aanpassen.
Er zijn veel velden die beginnen met Right_. Deze velden lijken duplicaten te zijn van de andere velden. Deze dubbele velden wilt u niet in uw flow opnemen. Dit is iets dat u hier kunt oplossen in de stap Invoeren:
Om dit nu op te lossen, schakelt u het selectievakje uit voor alle velden die beginnen met Right_. Hierdoor wordt Tableau Prep verteld dat deze velden genegeerd en niet in de flow opgenomen moeten worden.
Tip: wanneer u in een stap bewerkingen voor opschoning uitvoert, zoals het verwijderen van velden, houdt Tableau Prep uw wijzigingen bij in het deelvenster Wijzigingen. Ook wordt een annotatie (in de vorm van een klein pictogram) toegevoegd in het deelvenster Flow, zodat u de acties beter kunt bijhouden die u met uw data uitvoert. Bij Invoerstappen wordt aan elk veld ook een annotatie toegevoegd.
Klik in het deelvenster Flow op de Invoerstap Orders_Central om deze te selecteren. In het deelvenster Invoeren merkt u de volgende problemen op:
De bestel- en verzenddata zijn onderverdeeld in velden voor maand, dag en jaar.
- Sommige velden hebben andere datatypen dan dezelfde velden in andere bestanden.
Er is geen veld voor Regio.
U moet deze velden opschonen voordat u dit bestand met de andere bestanden kunt combineren. Maar u kunt dat hier niet oplossen in de stap Invoeren. Daarom maakt u een annotatie om dit later te doen
Selecteer de invoerstap Orders_East.
De velden in dit bestand lijken goed bij de andere bestanden te passen. Maar de waarden voor Sales lijken allemaal de valutacode te bevatten. Dat moet u later ook nog oplossen.
Nu u een aantal storende factoren in uw datasets hebt geïdentificeerd, is de volgende stap om uw data wat nauwkeuriger te onderzoeken en eventuele problemen op te lossen. Zo kunt u uw data combineren en vormgeven en een uitvoerbestand genereren dat u voor analyse kunt gebruiken.
3. Uw data opschonen
In Tableau Prep is het onderzoeken en opschonen van uw data een iteratief proces. Nadat u hebt besloten met welke dataset u wilt werken, is de volgende stap het onderzoeken en uitvoeren van acties op die data door verschillende bewerkingen voor opschonen, vormgeven en combineren toe te passen. U past deze bewerkingen toe door stappen aan uw flow toe te voegen. Zie Data opschonen en vormgeven(Link wordt in een nieuw venster geopend) voor meer informatie over opties bij opschonen.
Stappen zijn er in vele smaken, afhankelijk van wat u probeert te doen. Voeg bijvoorbeeld een opschoningsstap toe wanneer u bewerkingen voor opschonen wilt toepassen op uw velden, zoals filteren, samenvoegen, splitsen, naam wijzigen, enzovoort. Voeg een aggregatiestap toe om velden te groeperen en te aggregeren en het detailniveau van uw data te wijzigen. Zie Uw flow bouwen en organiseren(Link wordt in een nieuw venster geopend) voor meer informatie over de verschillende soorten stappen en hun toepassingen.
Tip: als u stappen aan uw flow toevoegt, wordt er automatisch een flowlijn toegevoegd om de stappen met elkaar te verbinden. U kunt deze flowlijnen verplaatsen en indien nodig verwijderen of toevoegen.
Wanneer u uw flow uitvoert, zijn deze verbindingspunten vereist. Zo weet Tableau Prep welke stappen zijn verbonden en in welke volgorde de stappen in de flow van toepassing zijn. Als er een flowlijn ontbreekt, wordt de flow onderbroken en krijgt u een foutmelding.
Clean Orders_Central
Om de problemen die u eerder hebt opgemerkt aan te pakken en om te zien of er nog andere problemen zijn, begint u met het toevoegen van een opschoningsstap aan de invoerstap Orders_Central.
Selecteer in het deelvenster Flow de optie Orders_Central en voer dan een van de volgende acties uit:
- Klik op het pictogram plus en voeg een opschoningsstap toe. Afhankelijk van uw versie is deze menu-optie Stap toevoegen, Opschoningsstap toevoegen of Opschoningsstap.
Klik op de voorgestelde opschoningsstap (Tableau Prep Builder versie 2020.3.3 en later en op het web)
Wanneer u een opschoningsstap aan uw flow toevoegt, verandert de werkruimte en ziet u de details van uw data.
A. Deelvenster Flow, B. Werkbalk, C. deelvenster Profiel, D. Dataraster
De werkruimte is nu verdeeld in drie delen: het deelvenster Flow, het deelvenster Profiel met een werkbalk en het raster Data.
In het deelvenster Profiel ziet u de structuur van uw data en worden de veldwaarden samengevat in categorieën. Zo kunt u snel gerelateerde waarden bekijken en uitschieters en null-waarden ontdekken. In het raster Data ziet u de rijniveaudetails voor uw velden.
Tip: elk veld in het deelvenster Profiel wordt weergegeven op een profielkaart. Gebruik het menu Meer opties (vervolgkeuzepijltje in eerdere versies) op elke kaart om de verschillende opties voor opschoning te bekijken en te selecteren die beschikbaar zijn voor dat veldtype. U kunt ook de veldwaarden sorteren, het datatype wijzigen, een datarol aan het veld toewijzen of de profielkaarten en kolommen in het raster Data slepen en neerzetten om ze opnieuw te ordenen.
Opgeschoonde data met berekende velden
In deze dataset ontbreekt er een veld voor Regio. Omdat de andere datasets dit veld al bevatten, moet u het veld toevoegen zodat u uw data later kunt combineren. Hiervoor moet u een berekend veld gebruiken.
Klik in de werkbalk op Berekend veld maken.
Geef het berekende veld de naam Regio in het editor voor Berekening. Voer dan ”Central” in (inclusief de aanhalingstekens) en klik op Opslaan.
U bent blij met de flexibiliteit waarmee u berekende velden kunt gebruiken om uw data vorm te geven. U bent ook blij om te zien dat Tableau Prep dezelfde taal voor de editor Berekening gebruikt als Tableau Desktop.
Tip: wanneer u wijzigingen aanbrengt in uw velden en waarden, houdt Tableau Prep deze bij in het deelvenster Wijzigingen aan de linkerkant. Er wordt ook een pictogram (annotatie) toegevoegd aan de opschoningsstap in de flow en aan het veld in het deelvenster Profiel. We zullen kijken naar het deelvenster Wijzigingen nadat u meer wijzigingen hebt aangebracht.
Vervolgens wilt u de afzonderlijke velden voor de bestel- en de verzenddatum aanpassen. U wilt deze combineren in twee afzonderlijke velden: één voor Order Date en één voor Ship Date. Zo komen ze overeen met dezelfde velden in de andere datasets. Als u ervoor zorgt dat uw tabellen dezelfde velden hebben, kunt u ze later combineren met een vereniging.
U kunt dit in één eenvoudige stap doen door opnieuw een berekend veld te gebruiken.
Klik in de werkbalk op Berekend veld maken om de velden Order Year, Order Month en Order Day te combineren in één veld met de notatie ‘MM/DD/JJJJ’.
Geef in de berekeningseditor het berekende veld de naam Order Date. Voer vervolgens de volgende berekening in en klik op Opslaan:
MAKEDATE([Order Year],[Order Month],[Order Day])
Nu u een nieuw veld voor uw besteldatum hebt, wilt u de bestaande velden verwijderen, omdat u ze niet meer nodig hebt.
U hebt veel velden in het deelvenster Profiel. U ziet een vakje Zoeken in de rechterbovenhoek van de werkbalk. U vraagt zich af of u dit kunt gebruiken om snel de velden te vinden die u wilt verwijderen. U besluit het eens te proberen.
Typ, in het deelvenster Profiel, in het zoekvak Order.
Tableau Prep gaat snel door alle velden met Volgorde in de naam in de weergave. Leuk!
Ctrl-klik of Cmd-klik (MacOS) om de velden te selecteren voor Order Year, Order Month en Order Day. Klik vervolgens met de rechtermuisknop op de geselecteerde velden en selecteer Verwijderen (Veld verwijderen (in eerdere versies) in het menu om ze te verwijderen.
Herhaal nu de stappen 4 tot en met 7 hierboven om één enkel veld te maken voor Order Date. Probeer het zelf of volg de onderstaande stappen om u te helpen.
Klik in de werkbalk op Berekend veld maken om Ship Year, Ship Month en Ship Day velden te combineren in één veld met de notatie ‘MM/DD/JJJJ’.
Geef het berekende veld de naam Ship Date en voer de volgende berekening in:
MAKEDATE([Ship Year],[Ship Month],[Ship Day])
. Klik dan op Opslaan.Verwijder de velden Ship Year, Ship Month en Ship Date. Zoek naar de velden, selecteer ze en selecteer vervolgens Verwijderen (Veld verwijderen (in eerdere versies) in het menu om de velden te verwijderen.
Tip: Tableau Prep vat de data in het deelvenster Profiel samen in blokken. Zo kunt u snel de vorm van uw data bekijken, uitschieters vinden, relaties tussen velden herkennen, enzovoort.
In dit scenario kunnen de bestel- en verzenddatums nu per jaar worden samengevat. Elke bin vertegenwoordigt een jaar, van januari van het beginjaar tot januari van het daaropvolgende jaar, en is dienovereenkomstig gelabeld. Omdat er verkoop- en verzenddata zijn die in het laatste deel van 2018 en 2019 vallen, krijgen we een bin voor die data die is gelabeld met de eindjaren 2019 en 2020.
Om deze weergave te wijzigen naar de werkelijke data, klikt u op het menu Meer opties (vervolgkeuzepijltje in eerdere versies) in de profielkaart en selecteer Detail.Rechtstreeks met velden werken om uw data op te schonen
Uw data beginnen er goed uit te zien. Maar als u klaar bent met het verwijderen van de extra velden voor de bestel- en verzenddatums, merkt u dat het veld Discounts een paar problemen heeft.
Dit is toegewezen aan een datatype Tekenreeks in plaats van een datatype Getal (decimaal).
Er is een veldwaarde Geen in plaats van een numerieke waarde voor geen korting.
Dit kan een probleem veroorzaken als u de bestanden samenvoegt. U kunt dat dus het beste ook oplossen.
Wis uw zoekopdracht en voer disc in het zoekvak in om het veld te vinden.
Selecteer het veld Discounts, dubbelklik op de veldwaarde Geen en verander het in de numerieke waarde 0.
Om het datatype te wijzigen voor het veld Discount van Tekenreeks naar Getal (decimaal), klikt u op Abc en selecteert u Getal (decimaal) uit het keuzemenu.
Geef tot slot een naam aan uw stap, zodat u gemakkelijker kunt bijhouden wat u in deze stap hebt gedaan. Dubbelklik in het deelvenster Flow op de stapnaam Opschonen 1 en typt u Datums/veldnamen corrigeren in.
Uw wijzigingen controleren
U hebt een groot aantal wijzigingen in de dataset aangebracht en u begint zich zorgen te maken dat u zich niet alles kunt herinneren wat u hebt gedaan. Als u uw werk bekijkt, ziet u aan de linkerkant van het deelvenster Profiel een kolom genaamd Wijzigingen.
U klikt op de pijl om deze te openen en ziet tot uw genoegen een lijst met alle wijzigingen die u zojuist hebt aangebracht. Terwijl u door de wijzigingen in de lijst bladert, ziet u dat u uw wijzigingen kunt verwijderen, bewerken en zelfs kunt verplaatsen om de volgorde te wijzigen waarin u ze hebt aangebracht.
U vindt het geweldig dat u tijdens het bouwen van uw flow eenvoudig de wijzigingen kunt terugvinden die u in elke stap hebt aangebracht. U kunt ook experimenteren met de volgorde van de wijzigingen om zo het maximale uit uw data te halen.
Uw werk controleren: bekijk ’Clean Orders_Central’ in actie.
Klik op de afbeelding om deze opnieuw af te spelen
Nu u één bestand hebt opgeschoond, bekijkt u de andere bestanden om te zien welke andere problemen u moet oplossen.
U besluit om vervolgens naar het Excel-bestand te kijken voor Orders_East.
Orders_East opschonen
Terwijl u de velden bekijkt van het bestand Orders_East, lijken de meeste velden overeen te komen met de andere bestanden, behalve Sales. Om dit nader te bekijken en te zien of er nog andere problemen zijn die aangepakt moeten worden, voegt u een opschoningsstap toe aan de invoerstap Orders_East.
Selecteer Orders_East in het deelvenster Flow en voer een van de volgende handelingen uit:
- Klik op het pictogram plus en voeg een opschoningsstap toe. Afhankelijk van uw versie is deze menu-optie Stap toevoegen, Opschoningsstap toevoegen of Opschoningsstap.
- Klik op de voorgestelde opschoningsstap (Tableau Prep Builder versie 2020.3.3 en later en op het web).
Kijkend naar het veld Sales ziet u snel dat de valutacode Amerikaanse dollar is opgenomen in de verkoopcijfers. Tableau Prep heeft deze veldwaarden geïnterpreteerd als een tekenreeks.
Als u nauwkeurige verkoopdata wilt, moet u de valutacode uit dit veld verwijderen en het datatype wijzigen.
Het is eenvoudig om het datatype te corrigeren. U weet al hoe u dat moet doen. Maar er zijn meer dan 2.000 unieke rijen met verkoopdata en het lijkt lastig om elke afzonderlijke rij te corrigeren en zo de valutacode te verwijderen.
Maar dit is Tableau Prep. U besluit om in het vervolgkeuzemenu te kijken of er een optie is om dit te verhelpen.
Wanneer u klikt op Meer opties (vervolgkeuzepijltje in eerdere versies) voor het veld Sales, ziet u een menuoptie genaamd Opschonen en daaronder een optie om letters te verwijderen. U besluit het te proberen en te zien wat dit doet.
Selecteer het veld Sales. Klik op het menu Meer opties (vervolgkeuzepijltje in eerdere versies) en selecteer Opschonen > Letters verwijderen.
Wauw! Door deze opschoonoptie is de valutacode direct uit elk veld verwijderd. Nu hoeft u alleen nog maar het datatype te wijzigen van Tekenreeks naar Getal (decimaal) en dit bestand ziet er goed uit.
Klik op het datatype voor het veld Sales en selecteer Getal (decimaal) in de vervolgkeuzelijst om het datatype te wijzigen.
De rest van het bestand ziet er redelijk goed uit. Geef uw opschoningsstap een naam, zodat u overzicht houdt over uw werk. Bijvoorbeeld: Datatype wijzigen.
Vervolgens kijkt u naar uw laatste bestand voor Orders_West om te zien of er problemen zijn die u moet oplossen.
Orders_West opschonen
Als u de velden bekijkt in het bestand Orders_West, zijn de meeste velden lijken uitgelijnd met de andere bestanden. Maar u herinnert zich dat u zag dat het veld Staten afkortingen gebruikte voor de waarden in plaats van de naam van de staat volledig uit te schrijven. Om dit bestand met de andere bestanden te kunnen combineren, moet u dit oplossen. Dus u voegt een opschoningsstap toe aan de invoerstap Orders_West.
Selecteer Orders_West in het deelvenster Flow en voer een van de volgende stappen uit:
- Klik op het pictogram plus en voeg een opschoningsstap toe.
- Klik op de voorgestelde opschoningsstap (Tableau Prep Builder versie 2020.3.3 en later en op het web).
Scroll of gebruik Zoeken om het veld Staat te vinden.
U ziet dat alle waarden van de staatsnaam de korte afkorting gebruiken. Er zijn slechts 11 unieke waarden voor dit veld. U kunt deze handmatig wijzigen. Maar misschien biedt Tableau Prep een andere manier om dit te doen?
U klikt op het menu Meer opties (vervolgkeuzepijltje in eerdere releases) voor het veld en ziet een optie genaamd Groepswaarden (Groeperen en vervangen in eerdere versies). Wanneer u deze optie selecteert, ziet u verschillende keuzes:
Handmatige selectie
Uitspraak
Veelgebruikte tekens
- Spelling
De namen van de staten klinken niet hetzelfde, ze zijn niet verkeerd gespeld en ze hebben niet dezelfde tekens. Dus u besluit om de optie Handmatige selectie te gebruiken.
Tip: u kunt dubbelklikken op een veldnaam of -waarde om één enkele waarde te bewerken. Om meerdere waarden te bewerken, kunt u alle waarden selecteren en de optie van het rechtermuisknopmenu Waarden bewerken gebruiken. Maar als u een of meer waarden aan specifieke waarden wilt toewijzen, gebruikt u de optie Waarden groeperen in het vervolgkeuzemenu.
Zie Veldwaarden bewerken(Link wordt in een nieuw venster geopend) voor meer informatie over het bewerken en groeperen van waarden.Selecteer het veld Staat. Klik op het vervolgkeuzepijltje en selecteer Waarden groeperen (Groeperen en vervangen in eerdere versies) > Handmatige selectie.
Er wordt een kaart met twee kolommen geopend. Dit is de Waarden groeperen-editor. De kolom aan de linkerkant toont de huidige veldwaarden en de kolom aan de rechterkant toont de velden die kunnen worden toegewezen aan de velden aan de linkerkant.
U wilt de afkortingen van uw staten toewijzen aan de volledig gespelde versie van de staatsnaam. Maar u hebt die waarden niet in de dataset Orders_West. U vraagt zich af of u de naam rechtstreeks kunt bewerken en deze daar kunt toevoegen. Dus u probeert het eens.
In de Waarden Groeperen-editor dubbelklikt u in het linkerdeelvenster op AZ om de waarde te highlighten en u typt Arizona. Druk dan op Enter om uw wijziging toe te voegen.
Tableau Prep heeft een toegewezen waarde voor uw nieuwe waarde gemaakt: Arizona. Ook is de oude waarde, AZ, hieraan automatisch toegewezen. Als u voor deze waarden een toegewezen relatie instelt, bespaart u tijd als u meer data uit dit gebied op deze manier invoert.
Tip: u kunt veldwaarden toevoegen die niet in uw datasteekproef voorkomen, om relaties voor toewijzen in te stellen en zo uw data te ordenen. Als u uw databron vernieuwt en er nieuwe data worden toegevoegd, kunt u de nieuwe data aan de toewijzing toevoegen in plaats van elke waarde handmatig te corrigeren.
Wanneer u handmatig een waarde toevoegt die niet in uw datasteekproef voorkomt, wordt de waarde gemarkeerd met een rode stip, zodat u deze gemakkelijk kunt identificeren.Herhaal deze stappen om elke staat toe te wijzen aan de volledig gespelde versie van de naam.
Afkorting Staatsnaam AZ Arizona CA Californië CO Colorado ID Idaho MT Montana NM New Mexico NV Nevada OR Oregon UT Utah WA Washington WY Wyoming Klik dan op Gereed om de Waarden groeperen-editor te sluiten.
Nadat alle staten zijn toegewezen, kijkt u naar het deelvenster Wijzigingen. Dan ziet u dat er slechts één item is in plaats van 11.
Tableau Prep groepeert vergelijkbare acties voor een veld. Dat vindt u fijn, want zo kunt u later gemakkelijker de wijzigingen terugvinden die u in uw dataset hebt aangebracht.
Het repareren van de veldwaarden voor Staat was de enige wijziging die u hier hoefde door te voeren.
Geef uw opschoningsstap een naam, zodat u overzicht houdt over uw werk. Bijvoorbeeld Staatsnamen wijzigen.
U hebt uw bestanden flink opgeruimd en u kunt niet geloven hoe snel en gemakkelijk dat ging. Misschien bent u toch nog thuis voor het avondeten! Om er zeker van te zijn dat u niet al uw werk tot nu toe kwijtraakt, kunt u uw flow opslaan.
Opmerking: als u op internet werkt, worden uw wijzigingen automatisch opgeslagen terwijl u bezig bent, waardoor er een conceptflow ontstaat. Klik op de titel van het concept om het een naam te geven. Zie Tableau Prep op het internet in de Help bij Tableau Server(Link wordt in een nieuw venster geopend) of Tableau Cloud(Link wordt in een nieuw venster geopend) voor meer informatie over webauthoring.
Klik op Bestand > Opslaan of Bestand > Opslaan als. Sla uw bestand op als flowbestand (.tfl) en geef het een naam. Bijvoorbeeld: My Superstore.
Tip: Wanneer u uw flowbestanden opslaat, kunt u ze opslaan als flowbestand (.tfl) of als verpakt bestand (.tflx) en deze samen met uw lokale databestanden verpakken om de flow en bestanden met iemand anders te delen. Zie Uw werk opslaan en delen(Link wordt in een nieuw venster geopend) voor meer informatie over het opslaan en delen van uw flows.
4. Uw data combineren
Nu alle bestanden zijn opgeschoond, kunt u ze eindelijk combineren.
Omdat alle bestanden na het opschonen vergelijkbare velden bevatten, moet u de tabellen samenvoegen om alle rijen in één tabel te krijgen.
U herinnert zich dat er een stapoptie was genaamd Vereniging. Maar u vraagt zich af of u de stappen eenvoudigweg kunt slepen en neerzetten om ze samen te voegen. U besluit het te proberen om te kijken wat er gebeurt.
Uw data verenigen
Volg de stappen die passen bij uw werk.
Tableau Prep Builder
Sleep in het deelvenster Flow de opschoningsstap Staatsnamen wijzigen naar de opschoningsstap Datatype gewijzigd en zet deze neer op de optie Vereniging.
U ziet dat Tableau Prep Builder een nieuwe stap voor Vereniging aan uw flow heeft toegevoegd. Top! Nu wilt u de andere bestanden ook aan deze vereniging toevoegen.
Tableau Server of Tableau Cloud
Sleep in het deelvenster Flow de opschoningsstap Staatsnamen wijzigen naar de stap voor Vereniging die u eerder voor uw South-bestanden hebt gemaakt en zet deze neer op de optie Toevoegen.
U ziet dat Tableau Prep uw nieuwe bestanden aan uw vorige vereniging heeft toegevoegd. Top! Nu wilt u de andere bestanden ook aan deze vereniging toevoegen.
Sleep de volgende opschoningsstap in de flow naar de stap Vereniging en zet dan neer op Toevoegen om het toe te voegen aan de bestaande vereniging.
Sleep de resterende stap (invoerstap orders_south_2015 als u in Tableau Prep Builder werkt of uw opschoningsstap als u op het web werkt) naar de nieuwe stap Vereniging. Zet neer op Toevoegen om het toe te voegen aan de bestaande vereniging.
Nu zijn al uw bestanden gecombineerd in één tabel. Selecteer in het deelvenster Flow de nieuwe stap Vereniging om uw resultaten te bekijken.
In Tableau Prep Builder:
In Tableau Server of Tableau Cloud:
U ziet dat Tableau de velden met dezelfde naam en hetzelfde type automatisch vergelijkt.
U ziet ook dat de kleuren die zijn toegewezen aan de stappen in de flow worden gebruikt in de verenigingsprofielen om aan te geven waar het veld vandaan komt. Deze verschijnen ook in de gekleurde band bovenin elk veld om aan te geven of dat veld in de tabel voorkomt.
U merkt dat een nieuw veld genaamd Tabelnamen is toegevoegd. Hierin worden de tabellen weergegeven waar alle rijen in de vereniging vandaan komen.
In het samenvattingsvenster wordt ook een lijst met niet-overeenkomende velden weergegeven. U kunt hier direct zien dat de velden Product en Discounts alleen in het bestand Orders_Central staan.
Om deze velden nader te bekijken, selecteert u in het deelvenster Verenigingsresultaten het selectievakje Alleen niet-overeenkomende velden weergeven.
Als u naar de velddata kijkt, ziet u dat de data hetzelfde zijn, maar dat de veldnaam anders is. U kunt het veld eenvoudigweg een andere naam geven. Maar u vraagt zich af of u de velden niet gewoon kunt slepen en neerzetten om ze samen te voegen. U besluit het te proberen en dan ziet u het wel.
Selecteer het veld Product en sleep het naar het veld Productnaam om de velden samen te voegen. Nadat de velden zijn samengevoegd, worden ze niet meer in het deelvenster weergegeven.
Herhaal deze stap om het veld Discounts samen te voegen met het veld Discount.
Het enige veld dat nu geen overeenkomst heeft, is het veld Bestandspaden. In Tableau Prep Builder worden in dit veld de bestandspaden weergegeven voor de verenigingen met een jokerteken die u hebt gemaakt voor uw verkooporders uit het zuiden. U besluit dit veld daar te laten staan, omdat het goede informatie bevat.
Tip: u hebt verschillende opties om niet-overeenkomende velden na een vereniging te herstellen. Als Tableau Prep een mogelijke overeenkomst detecteert, krijgt deze een gele highlight. Om de velden samen te voegen, beweegt u de cursor over het gehighlighte veld en klikt u op de knop plus die verschijnt.
Zie Niet-overeenkomende velden herstellen voor meer manieren om velden samen te voegen in een vereniging.Vink het selectievakje Alleen niet-overeenkomende velden weergeven uit om alle velden weer te geven die in de vereniging zijn opgenomen.
Geef uw stap voor vereniging een naam die aangeeft wat deze vereniging inhoudt. Bijvoorbeeld: Alle bestellingen.
Uw werk controleren: bekijk hoe 'Uw data verenigen' werkt.
Klik op de afbeelding om deze opnieuw af te spelen
U bent een genie in opschonen! Terwijl u uw resultaten bewondert, belt uw baas. Hij vergat te vermelden dat hij wil dat u ook eventuele retourzendingen in uw analyse opneemt. Hij hoopt dat dit niet te veel moeite zal kosten. Met Tableau Prep in uw toolkit is dit geen enkel probleem!
De data van productretouren opschonen
U bekijkt het Excel-bestand dat uw baas u heeft gestuurd voor productretouren en het ziet er wat rommelig uit. U voegt het nieuwe bestand return_reasons new toe aan uw flow om er eens beter naar te kijken.
Klik in het deelvenster Verbindingen op Verbinding toevoegen. Selecteer Microsoft Excel en ga naar de voorbeelden van databestanden die u voor deze oefening hebt gebruikt. (Zie Voorbeeld bestanden om het bestand te downloaden.)
Selecteer return reasons_new.xlsx en klik vervolgens op Open om het bestand aan het deelvenster Flow toe te voegen.
Er zijn slechts vier velden die u uit dit bestand in uw flow wilt opnemen: Order ID, Product ID, Return Reason en Notes.
Vink in het deelvenster Invoeren voor returns_new het selectievakje uit bovenaan de meest linkse kolom uit om alle selectievakjes uit te schakelen. Vink vervolgens het selectievakje aan voor de velden Order ID, Product ID, Return Reason en Notes.
Wijzig de naam van de invoerstap zodat deze beter aansluit bij de data die in deze invoer zijn opgenomen. Dubbelklik in het deelvenster Flow op de naam van de invoerstap Returns_new en typ Returns (all) in.
Als u naar de voorbeelden van de veldwaarden kijkt, ziet u dat het veld Notes veel verschillende, gecombineerd data lijkt te bevatten.
U moet het bestand nog een aantal keer opschonen voordat u verder kunt met de data. Daarom voegt u een opschoningsstap toe om de data te controleren.
Selecteer in het deelvenster Flow de invoerstap Returns (all), klik op het pictogram plus of op de voorgestelde opschoningsstap om een opschoningsstap toe te voegen.
Wijzig in het deelvenster Profiel het formaat van het veld Notes zodat u de invoer beter kunt zien. Om dit te doen, klikt u op de rechterbuitenrand van het veld en sleept u deze naar rechts.
Gebruik in het veld Notes de visuele schuifbalk rechts van de veldwaarden om de waarden te scannen.
Er zijn een paar dingen die u opvallen die problematisch kunnen zijn:
Sommige vermeldingen bevatten een extra spatie. Dit kan ertoe leiden dat het veld als null-waarde wordt gelezen.
Het lijkt erop dat de naam van de goedkeurder is opgenomen in de invoer voor retournotities. Om beter met deze data te kunnen werken, wilt u deze informatie in een apart veld zetten.
Om de extra spaties aan te pakken, bedenkt u zich dat er een optie voor opschonen was om afsluitende spaties te verwijderen. U besluit dat uit te proberen om te zien of het probleem hiermee wordt opgelost.
Selecteer het veld Notes. Klik op het menu Meer opties (vervolgkeuzepijltje in eerdere versies) en selecteer Opschonen > Spaties verwijderen.
Ja. Dit deed precies wat u wilde. De extra spaties zijn weg.
Vervolgens wilt u een apart veld maken voor de naam van de goedkeurder. U ziet een optie Gesplitste waarden in het menu. Dus u besluit dat eens te proberen.
Selecteer het veld Notes. Klik op het menu Meer opties (vervolgkeuzepijltje in eerdere versies) en selecteer Gesplitste waarden > Automatische splitsing.
Deze optie deed precies wat u ervan hoopte. De retournotities en de naam van de goedkeurder zijn automatisch in aparte velden gesplitst.
Net als Tableau Desktop heeft Tableau Prep automatisch een naam aan die velden toegewezen. U moet de nieuwe velden dus een betekenisvolle naam geven.
Selecteer het veld Notes-Split 1. Dubbelklik op de veldnaam en typ Return Notes.
Herhaal deze stap voor het tweede veld en wijzig de naam in Goedkeurder.
Verwijder ten slotte het originele veld Notes, omdat u het niet meer nodig hebt. Selecteer het veld Notes veld, klik op het menu Meer opties (vervolgkeuzepijltje in eerdere versies) en selecteer Verwijderen (Veld verwijderen (in eerdere versies) via het menu.
Als u kijkt naar het nieuwe veld Goedkeurder, ziet u dat de veldwaarden dezelfde namen bevatten, maar dat ze anders zijn ingevoerd. U wilt ze groeperen om meerdere variaties van dezelfde waarde te voorkomen.
Misschien kan de optie de Waarden groeperen (Groeperen en vervangen in eerdere versies) hierbij helpen?
U weet nog dat er een optie was voor veelgebruikte tekens. Omdat deze waarden dezelfde letters delen, besluit u dat te proberen.
Selecteer het veld Goedkeurder. Klik op het menu Meer opties (vervolgkeuzepijltje in eerdere versies) en selecteer Waarden groeperen (Groeperen en vervangen in eerdere versies) > Veelgebruikte tekens.
Door deze optie worden alle variaties van elke naam voor u gegroepeerd. Dat is precies wat u wilde doen.
Nadat u de andere namen hebt gecontroleerd om er zeker van te zijn dat deze correct zijn gegroepeerd, klikt u op Klaar om de Waarden groeperen-editor te sluiten.
Dit bestand ziet er goed uit.
Geef uw opschoningsstap een naam, zodat u overzicht houdt over uw werk. Bijvoorbeeld: Opgeschoonde notities.
Nu alle productretourdata zijn opgeschoond, wilt u deze data toevoegen aan de besteldata uit uw samengevoegde bestanden. Maar veel van deze velden bestaan niet in de samengevoegde bestanden. Om deze velden (kolommen met data) aan uw samengevoegde dataset toe te voegen, moet u een join gebruiken.
Een join maken van uw data
Wanneer u data samenvoegt, moeten de bestanden minimaal één veld gemeenschappelijk hebben. Uw bestanden delen de velden Order ID en Product ID. Daarom kunt u met die velden samenvoegen om alle rijen te zien die die gemeenschappelijke velden bevatten. U herinnert zich de optie om een join te maken toen u uw vereniging maakte van slepen en neerzetten. Dus u probeert dat eens.
Sleep in het deelvenster Flow de stap Opgeschoonde notities op de stap voor vereniging All orders en zet neer op Join.
Wanneer u joins maakt voor bestanden, toont Tableau Prep u de resultaten van uw join in Profiel van join.
Werken met joins kan lastig zijn. Vaak wilt u een duidelijk overzicht van de factoren die in de join zijn opgenomen, zoals de velden die worden gebruikt om de bestanden samen te voegen, het aantal rijen dat in de resultaten is opgenomen en alle velden die niet zijn opgenomen of null-waarden bevatten.
Wanneer u de resultaten van de join in Tableau Prep bekijkt, zult u versteld staan van de hoeveelheid informatie en de interactieve mogelijkheden die u tot uw beschikking hebt.
Tip: in het linkerdeelvenster van het joinprofiel kunt u uw join verkennen en ermee communiceren. U kunt waarden ook rechtstreeks bewerken in het deelvenster JOIN-componenten en bewerkingen voor opschonen uitvoeren in het deelvenster Join-resultaten.
Klik in het diagram Join-type om verschillende join-configuraties uit te proberen en het aantal rijen te bekijken dat is opgenomen in of uitgesloten van uw join voor elke tabel in de sectie Samenvatting van join-resultaten.
Selecteer de velden waarvoor u joins wilt maken in het gedeelte Toegepaste JOIN-componenten of voeg voorgestelde JOIN-componenten toe uit het gedeelte Aanbevelingen voor JOIN-componenten.
Zie Data aggregeren, een join maken of verenigen(Link wordt in een nieuw venster geopend) voor meer informatie over het werken met joins.U ziet dat u meer dan 13.000 rijen hebt uitgesloten van uw bestanden All Orders. Toen u uw join maakte, maakte Tableau Prep automatisch een join via het veld Product ID, maar u wilde ook een join maken van het veld Order ID.
Als u het linkerdeelvenster van het joinprofiel scant, ziet u dat Order ID staat in de lijst met Aanbevolen JOIN-componenten, zodat u deze daar snel kunt toevoegen.
Selecteer in het linkerdeelvenster van het profiel van de Join, in het deel Aanbevelingen voor JOIN-componenten, Order ID = Order ID en klik op de knop plus om de JOIN-component toe te voegen.
Omdat het Join-type is ingesteld op een join binnen (de standaardinstelling voor Tableau Prep), neemt de join alleen waarden op die in beide bestanden voorkomen. Maar u wilt alle data van uw bestanden Orders en de retourdata voor die bestanden. U moet het join-type dus wijzigen.
Klik in het deel Join-type op de zijkant van het diagram om alle orders op te nemen. Klik in het onderstaande voorbeeld op de linkerkant van het diagram om het join-type te wijzigen in een join Links en om alle data toe te voegen van de stap voor vereniging All Orders en alle overeenkomende data van de stap Opgeschoonde notities.
Nu beschikt u over alle data uit de verkooporderbestanden en alle retourdata die op die orders van toepassing zijn. U bekijkt het deelvenster JOIN-componenten en ziet de afzonderlijke waarden die niet in het andere bestand voorkomen.
Er zijn bijvoorbeeld veel orderrijen (weergegeven in het rood) die geen bijbehorende retourdata bevatten. U vindt het geweldig dat u zo gedetailleerd op de hoogte bent van uw join.
U wilt deze data graag analyseren in Tableau Desktop. Maar dan ziet u een paar resultaten van de join die u eerst wilt opschonen. Gelukkig weet u wat u moet doen!
Tip: vraagt u zich af of uw data schoon genoeg zijn? Vanuit Tableau Prep Builder kunt u een voorbeeld van uw data in Tableau Desktop bekijken vanuit elke stap in uw flow om deze te controleren.
Klik gewoon met de rechtermuisknop op de stap in het deelvenster Flow en selecteer Voorbeeld in Tableau Desktop uit het menu.
U kunt experimenteren met uw data. Wijzigingen die u in Tableau Desktop aanbrengt, worden niet teruggeschreven naar uw databron in Tableau Prep Builder. Zie De flowuitvoer weergeven in Tableau Desktop(Link wordt in een nieuw venster geopend) voor meer informatie.Voordat u begint met het opschonen van uw join-resultaten, geeft u uw Join-stap de naam Orders+Returns en slaat u uw flow op.
Uw join-resultaten opschonen
Opmerking: om de velden in uw join op te schonen, kunt u de bewerkingen voor opschonen rechtstreeks in de Join-stap uitvoeren. Voor deze tutorial voegen we een opschoningsstap toe, zodat u uw bewerkingen voor opschonen duidelijk kunt zien. Als u deze stappen rechtstreeks in de join-stap wilt uitvoeren, slaat u stap 1 en 3 hieronder over.
Toen u een join maakte voor de twee stappen, werden de gemeenschappelijke velden Order ID en Product ID voor beide tabellen toegevoegd.
U wilt het veld Product ID uit al uw bestellingen en het veld Order ID uit het retourbestand behouden en de dubbele velden uit die bestanden verwijderen. U hebt de velden Bestandspaden en Tabelnamen in uw uitvoerbestand ook niet nodig. Dus u wilt die velden ook verwijderen.
Tip: wanneer u tabellen samenvoegt met velden die in beide bestanden voorkomen, haalt Tableau Prep beide velden op en wordt de naam gewijzigd van het dubbele veld uit het tweede bestand door '-1' of '-2' aan de veldnaam toe te voegen. Bijvoorbeeld Order ID en Order ID-1.
Selecteer Orders+Returns in het deelvenster Flow, klik op het pictogram plus en voeg een opschoningsstap toe.
Selecteer in het deelvenster Profiel de volgende velden en verwijder deze:
Tabelnamen
Order ID
Bestandspaden (alleen Tableau Prep Builder)
Product ID-1
Wijzig e naam van het veld Order ID-1 in Order ID.
Er zijn nogal wat null-waarden, waarbij het product is geretourneerd, maar er geen retournotitie of goedkeurder is aangegeven. Om deze data gemakkelijker te kunnen analyseren, wilt u een veld toevoegen met een waarde van Ja en Nee om aan te geven of het product is geretourneerd.
U beschikt niet over dit veld, maar u kunt het toevoegen door een berekend veld te maken.
Klik in de werkbalk op Berekend veld maken.
Geef het veld de naam Returned? en voer vervolgens de volgende berekening in en klik dan op Opslaan.
If ISNULL([Return Reason])=FALSE THEN "Yes" ELSE "No" END
Voor uw analyse wilt u ook weten hoeveel dagen het duurt om een bestelling te verzenden, maar ook dat veld ontbreekt.
U beschikt echter over alle informatie die u nodig hebt om het te maken. Dus u voegt een extra berekend veld toe om het te maken.
Klik in de werkbalk op Berekend veld maken.
Geef het veld de naam Days to Ship, voer vervolgens de volgende berekening in en klik dan op Opslaan.
DATEDIFF('day',[Order Date],[Ship Date])
Geef uw stap de naam Clean Orders +Returns.
Sla uw flow op.
5. Uw flow uitvoeren en uitvoer genereren
Uw data zien er goed uit en u bent klaar om uw uitvoerbestand te genereren en deze te analyseren in Tableau Desktop. Het enige wat u hoeft te doen is uw flow uitvoeren en uw extractbestand genereren. Om dit te doen moet u een Uitvoerstap toevoegen.
Afhankelijk van waar u werkt, kunt u uw flow uitvoeren naar een bestand (alleen Tableau Prep Builder), naar een gepubliceerde databron of naar een database.
Selecteer Clean Orders+Returns in het deelvenster Flow, klik op het pictogram plus en selecteer Uitvoer (Uitvoer toevoegen in eerdere versies).
Wanneer u een Uitvoerstap toevoegt, wordt het deelvenster Uitvoer geopend en ziet u een momentopname van uw data. Hier kunt u het type uitvoer selecteren dat u wilt genereren, en de naam en locatie opgeven waar u het bestand wilt opslaan.
De standaardlocatie is in de opslagplaats Mijn Tableau Prep Builder in uw directory met databronnen.
Voer in het linkerdeelvenster in de vervolgkeuzelijst Uitvoergegevens opslaan in, afhankelijk van waar u werkt, een van de volgende handelingen uit:
Tableau Prep Builder
- Selecteer Bestand (selecteer Opslaan in bestand in eerdere versies).
- Klik op de knop Bladeren en voer dan in het dialoogvenster Extract opslaan als een naam in voor het bestand. Bijvoorbeeld Orders_Returns_Superstore en klik op Accepteren.
Selecteer in het veld Type uitvoergegevens een type uitvoergegevens. Selecteer Tableau Data Extract (.hyper) voor Tableau Desktop of Comma Separated Values (.csv) als u het extract met een externe partij wilt delen.
Tableau Server of Tableau Cloud
- Selecteer Gepubliceerde databron.
- Selecteer een project.
Voer een naam in voor het bestand, bijvoorbeeld Orders_Returns_Superstore.
Tip: u hebt verschillende keuzes bij het genereren van uitvoer uit uw flow. U kunt een extractbestand genereren (alleen Tableau Prep Builder), u kunt uw data als databron publiceren naar Tableau Server of Tableau Cloud of u kunt uw data naar een database schrijven. Zie Data-extractbestanden en gepubliceerde databronnen maken(Link wordt in een nieuw venster geopend) voor meer informatie over het genereren van uitvoerbestanden.
Bekijk in het gedeelte Schrijfopties de opties om de nieuwe data naar uw bestanden te schrijven. U wilt de standaardwaarde gebruiken (Tabel maken) en de tabel vervangen door uw flowuitvoer, zodat hier niets hoeft te worden gewijzigd.
Tip: vanaf versie 2020.2.1 kunt u kiezen hoe u uw flowdata terug naar uw tabel wilt schrijven. U kunt kiezen uit twee opties: Tabel maken of Tabel toevoegen. Standaard gebruikt Tableau Prep de optie Tabel maken en worden uw tabeldata overschreven met de nieuwe data wanneer u uw flow uitvoert. Als u Tabel toevoegen kiest, voegt Tableau Prep de flowdata toe aan de bestaande tabel, zodat u zowel nieuwe als historische data bij elke flowuitvoering kunt bijhouden. Zie Schrijfopties configureren voor meer informatie.
Klik in het deelvenster Uitvoer op Flow uitvoeren of klik op de knop Flow uitvoeren in het deelvenster Flow om uw uitvoer te genereren.
Opmerking: als u op het web werkt, klikt u op Publiceren om uw conceptflow te publiceren. Alleen gepubliceerde flows kunnen worden uitgevoerd.
Zodra de flow is uitgevoerd, wordt in een statusdialoogvenster aangegeven of de flow succesvol is uitgevoerd en hoeveel tijd het heeft gekost om de flow uit te voeren. Klik op Gereed om het dialoogvenster te sluiten.
Als u op het web werkt, gaat u naar de pagina Verkennen>Alle flows. Daar vindt u uw flow. U kunt de status van uw flowuitvoering bekijken op de pagina Flowoverzicht.
Om uw data actueel te houden, kunt u de flow handmatig uitvoeren of de opdrachtregel gebruiken. Als u Databeheer heeft en u Tableau Prep Conductor hebt ingeschakeld, kunt u uw flow ook volgens een schema uitvoeren in Tableau Server of Tableau Cloud.
Vanaf Tableau Prep Builder versie 2020.2.1 en op het web kunt u er ook voor kiezen om alle data te vernieuwen telkens wanneer de flow wordt uitgevoerd, of om uw flow uit te voeren met incrementele vernieuwing en telkens alleen uw nieuwe data te verwerken.
Zie de volgende onderwerpen voor meer informatie over het actueel houden van uw data:
Samenvatting en bronnen
U bent een echte ster in datavoorbereiding! U hebt vervuilde data met gemak omgezet! Binnen de kortste keren hebt u uw data uit meerdere datasets opgeschoond, voorbereid en omgezet in een overzichtelijke, schone dataset waarmee u nu in Tableau Desktop uw analyses kunt uitvoeren.
Wilt u meer oefenen? Probeer de rest van de voorbeeldflow voor Superstore te repliceren met de databestanden die u hier kunt vinden:
- Orders_South_2015
- Orders_South_2016
- Orders_South_2017
- Orders_South_2018
- Orders_Central
- Orders_East
- Orders_West
- returns_reasons_new
- Quota
U kunt de bestanden ook op de volgende locatie op uw computer vinden nadat u Tableau Prep Builder hebt geïnstalleerd:
- (Windows)
C:\Program Files\Tableau\Tableau Prep Builder <version>\help\Samples\en_US\Superstore Files
- (Mac)
/Applications/Tableau Prep Builder <version>.app/Contents/help/Samples/en_US/Superstore Files
Wilt u meer training? Bekijk deze geweldige bronnen(Link wordt in een nieuw venster geopend) of neem een persoonlijke training(Link wordt in een nieuw venster geopend)scursus.
Wilt u meer informatie over de onderwerpen die we hebben behandeld? Bekijk de andere onderwerpen in de online help van Tableau Prep.