Data opschonen en vormgeven
Opmerking: Vanaf versie 2020.4.1 kunt u flows maken en bewerken in Tableau Server en Tableau Cloud. De inhoud van dit onderwerp is van toepassing op alle platforms, tenzij specifiek anders vermeld. Zie Tableau Prep op het web in de Help bij Tableau Server(Link wordt in een nieuw venster geopend) en Tableau Cloud(Link wordt in een nieuw venster geopend) voor meer informatie over flows maken op het web.
Tableau Prep biedt verschillende opschoonbewerkingen waarmee u uw data kunt opschonen en vormgeven. Door vervuilde data op te schonen, kunt u uw data gemakkelijker combineren en analyseren. Ook kunnen anderen uw data beter begrijpen wanneer u uw datasets deelt.
U kunt uw data ook opschonen met behulp van een draaistap of een scriptstap om R- of Python-scripts op uw flow toe te passen. Scriptstappen worden niet ondersteund in Tableau Cloud. Zie Uw data draaien(Link wordt in een nieuw venster geopend) of R- en Python-scripts in uw flow gebruiken(Link wordt in een nieuw venster geopend) voor meer informatie.
Over opschoonbewerkingen
U kunt data opschonen door opschoonbewerkingen uit te voeren, zoals het filteren, toevoegen, hernoemen, splitsen, groeperen of verwijderen van velden. U kunt opschoonbewerkingen uitvoeren in de meeste staptypen in uw flow. U kunt ook opschoonbewerkingen uitvoeren in het dataraster in een opschoonstap.
U kunt beperkte opschoonbewerkingen toepassen in de invoerstap, maar u kunt geen opschoonbewerkingen toepassen in de uitvoerstap. Zie Opschoonbewerkingen toepassen toepassen in een invoerstap(Link wordt in een nieuw venster geopend) voor meer informatie over het toepassen van opschoonbewerkingen in de invoerstap.
Beschikbare opschoonbewerkingen
In de volgende tabel ziet u welke opschoonbewerkingen beschikbaar zijn in elk staptype:
Invoeren | Opschonen | Aggregeren | Draaien | Een join maken | Vereniging | Nieuwe rijen | Uitvoer | |
Filter | X | X | X | X | X | X | X | |
Waarden groeperen | X | X | X | X | ||||
Opschonen | X | X | X | X | X | |||
Datums converteren | X | X | X | X | X | X | ||
Gesplitste waarden | X | X | X | X | X | |||
Veldnaam wijzigen | X | X | X | X | X | X | ||
Veldnamen wijzigen (in bulk) | X | |||||||
Dubbel veld | X | X | X | X | X | |||
Alleen veld behouden | X | X | X | X | X | X | X | |
Veld verwijderen | X | X | X | X | X | X | X | |
Berekend veld maken | X | X | X | X | X | |||
Waarde bewerken | X | X | X | X | X | |||
Datatype wijzigen | X | X | X | X | X | X | X |
Wanneer u wijzigingen aanbrengt in uw data, worden er aantekeningen toegevoegd aan de overeenkomstige stap in het deelvenster Flow en wordt er een invoer toegevoegd in het deelvenster Wijzigingen om uw acties bij te houden. Als u wijzigingen aanbrengt in de invoerstap, wordt de aantekening links van de stap in het deelvenster Flow en in het Invoerprofiel in de veldlijst getoond.
De volgorde waarin u uw wijzigingen toepast, is van belang. Wijzigingen die worden aangebracht in de staptypen Aggregeren, Draaien, Een join maken en Verenigen worden vóór of na deze opschoonacties uitgevoerd, afhankelijk van waar het veld zich bevindt op het moment dat u de wijziging doorvoert. Waar de wijziging is aangebracht, wordt getoond in het deelvenster Wijzigingen voor de stap.
Het volgende voorbeeld toont wijzigingen die in meerdere velden zijn aangebracht in een stap Een join maken. De wijziging wordt uitgevoerd vóór de actie Een join maken om de gecorrigeerde resultaten te verkrijgen.
Volgorde van bewerkingen
In de volgende tabel ziet u waar de opschoonactie wordt uitgevoerd in de staptypen Aggregeren, Draaien, Een join maken en Verenigen, afhankelijk van waar het veld zich in de stap bevindt.
Actie | Staptype: | Aggregeren | Aggregeren | Draaien | Draaien | Een join maken | Een join maken | Vereniging | Vereniging | Nieuwe rijen |
---|---|---|---|---|---|---|---|---|---|---|
Locatie veld: | Gegroepeerde velden | Geaggregeerde velden | Niet in draaien | Gemaakt van draaien | Opgenomen in één tabel* | Opgenomen in beide tabellen* | Niet-overeenkomende velden | Gecombineerde velden | Veld dat wordt gebruikt om rijen te genereren | |
Filter | Vóór aggregatie | Na aggregatie | Vóór draaien | Na draaien | Vóór een join maken | Na een join maken | Vóór vereniging | Na vereniging | Na nieuwe rijen | |
Waarden groeperen | N.v.t. | N.v.t. | Vóór draaien | Na draaien | Vóór een join maken | Na een join maken | Vóór vereniging | Na vereniging | Na nieuwe rijen | |
Opschonen | N.v.t. | N.v.t. | Vóór draaien | Na draaien | Vóór een join maken | Na een join maken | Vóór vereniging | Na vereniging | Na nieuwe rijen | |
Datums converteren | Vóór aggregatie | Na aggregatie | Vóór draaien | Na draaien | Vóór een join maken | Na een join maken | Vóór vereniging | Na vereniging | Na nieuwe rijen | |
Gesplitste waarden | N.v.t. | N.v.t. | Vóór draaien | Na draaien | Vóór een join maken | Na een join maken | Vóór vereniging | Na vereniging | Na nieuwe rijen | |
Veldnaam wijzigen | N.v.t. | N.v.t. | Vóór draaien | Na draaien | Vóór een join maken | Na een join maken | Vóór vereniging | Na vereniging | Vóór nieuwe rijen | |
Dubbel veld | N.v.t. | N.v.t. | Vóór draaien | Na draaien | Vóór een join maken | Na een join maken | Vóór vereniging | Na vereniging | Na nieuwe rijen | |
Alleen veld behouden | Na aggregatie | Na aggregatie | Vóór draaien | Na draaien | Vóór een join maken | Na een join maken | Vóór vereniging | Na vereniging | Na nieuwe rijen | |
Veld verwijderen | Verwijderen uit aggregatie | Verwijderen uit aggregatie | Vóór draaien | Na draaien | Vóór een join maken | Na een join maken | Vóór vereniging | Na vereniging | Na nieuwe rijen | |
Berekend veld maken | N.v.t. | N.v.t. | Vóór draaien | Na draaien | Na een join maken | Na een join maken | Vóór vereniging | Na vereniging | Na nieuwe rijen | |
Waarde bewerken | N.v.t. | N.v.t. | Vóór draaien | Na draaien | Vóór een join maken | Na een join maken | Vóór vereniging | Na vereniging | Na nieuwe rijen | |
Datatype wijzigen | Vóór aggregatie | Na aggregatie | Vóór draaien | Na draaien | Vóór een join maken | Vóór een join maken | Vóór vereniging | Na vereniging | Vóór nieuwe rijen |
Opmerking: Bij een join maken wordt de wijziging toegepast vóór een join maken, als het veld een berekend veld is dat werd gemaakt met behulp van een veld uit één tabel. Als het veld is gemaakt met velden uit beide tabellen, wordt de wijziging toegepast na een join maken.
Opschoonbewerkingen toepassen
Om opschoonbewerkingen toe te passen op velden gebruikt u de opties van de werkbalk of klikt u op Meer opties op de veldprofielkaart, het dataraster of het deelvenster Resultaten om het menu te openen.
In de staptypen Aggregeren, Draaien, Een join maken en Verenigen is het menu Meer opties beschikbaar op de profielkaarten in het deelvenster Resultaten en het bijbehorende dataraster. Als u steeds dezelfde opschoonbewerkingen of acties in uw flow uitvoert, kunt u uw stappen, acties en zelfs velden kopiëren en plakken. Zie Stappen, acties en velden kopiëren voor meer informatie.
Werkbalk van deelvenster Profiel | Vervolgkeuzemenu |
---|---|
Uw weergave selecteren
U kunt opschoonbewerkingen uitvoeren buiten het deelvenster Profiel of Resultaten in het dataraster of in de lijstweergave. Gebruik de weergavewerkbalk (Tableau Prep Builder-versie 2019.3.2 en hoger en op internet) om uw weergave te wijzigen en klik vervolgens op Meer opties op een veld om het opschoonmenu te openen.
Deelvenster Profiel weergeven: Dit is de standaardweergave. Selecteer deze knop om terug te gaan naar het deelvenster Profiel of het deelvenster Resultaten.
Dataraster weergeven: Vouw het deelvenster Profiel of Resultaten samen om het uit te vouwen en alleen het dataraster te tonen. Deze weergave biedt een gedetailleerdere weergave van uw data en kan handig zijn als u met specifieke veldwaarden moet werken. Nadat u deze optie selecteert, blijft deze weergavestatus behouden voor alle stappen in uw flow. U kunt deze echter op elk gewenst moment wijzigen.
Opmerking: Niet alle opschoonbewerkingen zijn beschikbaar in het dataraster. Als u bijvoorbeeld een waarde inline wilt bewerken, moet u het deelvenster Profiel gebruiken.
Lijstweergave tonen (Tableau Prep Builder-versie 2019.3.2 en hoger en op internet): Converteer het deelvenster Profiel of het deelvenster Resultaten naar een lijst. Nadat u deze optie selecteert, blijft deze weergavestatus behouden voor alle stappen in uw flow. U kunt deze echter op elk gewenst moment wijzigen.
In deze weergave kunt u:
- Meerdere rijen selecteren en verwijderen met behulp van de X-optie.
- (versie 2021.1.4 en hoger) Meerdere rijen selecteren en verbergen of weergeven met behulp van de -optie.
- (versie 2021.2.1 en hoger) Veldnamen wijzigen in bulk.
Gebruik het menu Meer opties om bewerkingen toe te passen op geselecteerde velden.
Als u een datarol toewijst aan het veld of Filter, Waarden groeperen, Opschonen of Gesplitste waarden selecteert, keert u terug naar de weergave Profiel of Resultaten op die acties te voltooien. Alle overige opties kunnen in de lijstweergave worden uitgevoerd.
Gebruik de weergavewerkbalk om het deelvenster Profiel te verbergen en alleen het dataraster weer te geven. Klik dan op Meer opties op een veld in het dataraster om het opschoonmenu te openen. Deze weergave toont een gedetailleerdere weergave van uw data en kan handig zijn als u met specifieke veldwaarden moet werken. Nadat u deze optie selecteert, blijft deze weergavestatus behouden voor alle stappen in uw flow. U kunt deze echter op elk gewenst moment wijzigen.
Opmerking: Niet alle opschoonbewerkingen zijn beschikbaar in het dataraster. Als u bijvoorbeeld een waarde inline wilt bewerken, moet u het deelvenster Profiel gebruiken.
Data-updates onderbreken om de prestaties te verbeteren
Terwijl u opschoonbewerkingen uitvoert op uw data, past Tableau Prep uw wijzigingen direct toe, zodat u direct de resultaten ziet. Om kostbare verwerkingstijd te besparen wanneer u weet welke wijzigingen u moet aanbrengen en u geen directe feedback nodig hebt terwijl u elke wijziging aanbrengt, kunt u de prestaties verbeteren door data-updates te onderbreken.
Wanneer u data-updates onderbreekt, kunt u alle wijzigingen in één keer doorvoeren en de updates vervolgens hervatten om de resultaten te bekijken. U kunt op elk gewenst moment data-updates hervatten en alle beschikbare bewerkingen inschakelen.
Opmerking: Wanneer u data-updates onderbreekt, worden alle bewerkingen uitgeschakeld waarvoor u uw waarden moet bekijken. Als u bijvoorbeeld een filter wilt toepassen op geselecteerde waarden, moet u de waarden zien die u wilt uitsluiten.
Klik in het bovenste menu op Data-updates onderbreken om updates te onderbreken.
Tableau Prep converteert het deelvenster Profiel in de Lijstweergave. Gebruik in de lijstweergave het menu Meer opties om bewerkingen toe te passen op geselecteerde velden. Als het voor de bewerking nodig is dat u uw waarden bekijkt, is deze optie uitgeschakeld. Om de bewerking in te schakelen, moet u de data-updates hervatten.
Zie Uw weergave selecteren voor meer informatie over het gebruik van de modus Lijstweergave.
Om de resultaten van uw wijzigingen te zien of om een uitgeschakelde functie in te schakelen, kunt u de data-updates hervatten. Klik op de knop Data-updates hervatten, klik op de knop Hervatten in het menudialoogvenster of in de berichtbanner bovenaan het deelvenster Flow.
Opmerking: Tableau Prep Builder geeft u de mogelijkheid om updates rechtstreeks vanuit het menu te hervatten. Als u flows via internet bewerkt, moet u de updates hervatten via het bovenste menu.
Opschoonbewerkingen toepassen
Om opschoonbewerkingen toe te passen op een veld, doet u het volgende:
Opmerking: U kunt opschoonbewerkingen uitvoeren in een lijstweergave vanaf Tableau Prep Builder-versie 2019.3.2 en op Tableau Server en Tableau Cloud vanaf versie 2020.4.
Selecteer in het deelvenster Profiel, het dataraster, het deelvenster Resultaten of de lijstweergave het veld waarin u wijzigingen wilt aanbrengen.
Selecteer een van de volgende opties vanuit de werkbalk of het menu Meer opties voor het veld:
Filter of Waarden filteren: Selecteer een van de filteropties, klik met de rechtermuisknop of Ctrl+Klik (MacOS) op een veldwaarde om waarden te behouden of uit te sluiten. U kunt ook het filter Geselecteerde waarden gebruiken om de waarden te kiezen die u wilt filteren, inclusief waarden die niet in de steekproef van uw flow zijn opgenomen. Zie Uw data filteren(Link wordt in een nieuw venster geopend) voor meer informatie over filteropties.
Waarden groeperen (Groeperen en vervangen in eerdere versies): Selecteer handmatig waarden of gebruik automatische groepering. U kunt ook meerdere waarden selecteren in de profielkaart en met de rechtermuisknop of Ctrl+Klik (MacOS) klikken om waarden te groeperen, het groeperen van waarden op te heffen of de groepswaarde te bewerken. Zie Waarden automatisch toewijzen aan een standaardwaarde met behulp van gedeeltelijke overeenkomst voor meer informatie over Waarden groeperen.
Opschonen: Selecteer uit een lijst met snelle opschoonbewerkingen die u op alle waarden in het veld wilt toepassen.
Datums converteren (Tableau Prep Builder-versie 2020.1.4 en hoger en op internet): Voor velden die zijn toegewezen aan een datatype Datum of Datum en tijd, selecteert u uit een lijst met snelle DATEPART-opschoonbewerkingen om uw datumveldwaarden te converteren naar een waarde met een geheel getal dat een jaar, kwartaal, maand, week, dag of een datum- en tijdwaarde vertegenwoordigt.
Vanaf versie 2021.1.4 kunt u ook kiezen uit twee snelle DATENAME-opschoonbewerkingen, dag van de week of naam van de maand, om uw datumveldwaarden te converteren.
Aangepast boekjaar (Tableau Prep Builder-versie 2020.3.3 en later en op internet): Als uw boekjaar niet in januari begint, kunt u een aangepaste fiscale maand instellen om de datum te converteren naar die maand in plaats van de standaardmaand januari.
Deze instelling geldt per veld. Als u een aangepast boekjaar op andere velden wilt toepassen, herhaalt u deze stap.
Om het dialoogvenster te openen, klikt u in het menu Meer opties en selecteert u Datums converteren > Aangepast boekjaar.
Gesplitste waarden: Splits waarden automatisch op basis van een gemeenschappelijk scheidingsteken of gebruik aangepast splitsen om op te geven hoe u veldwaarden wilt splitsen.
Automatisch splitsen en aangepast splitsen werken hetzelfde als in Tableau Desktop. Zie Een veld opsplitsen in meerdere velden(Link wordt in een nieuw venster geopend) in de helpsectie van Tableau Desktop en Webauthoring.
Veldnaam wijzigen: Bewerk de veldnaam.
Dubbel veld (Tableau Prep Builder-versie 2019.2.3 en hoger en op internet): Maak een kopie van uw veld en waarden.
Alleen veld behouden(Tableau Prep Builder-versie 2019.2.2 en hoger en op internet): Behoud alleen het geselecteerde veld en sluit alle andere velden in de stap uit.
Berekend veld maken: Schrijf een aangepaste berekening in de berekeningseditor of gebruik de visuele berekeningseditor (Tableau Prep Builder-versie 2020.1.1 en hoger en op internet) om berekeningen op basis van detailniveau, rangschikking of rijnummer te maken. Zie Berekeningen voor detailniveau, rangschikking en tegels maken voor meer informatie.
- Publiceren als datarol: Maak aangepaste datarollen die u vervolgens op uw velden kunt toepassen om de veldwaarden te valideren bij het opschonen van data. Zie Aangepaste datarollen maken(Link wordt in een nieuw venster geopend) voor meer informatie over deze optie.
- Veld verbergen: Als u velden hebt die u in uw flow wilt behouden, maar niet hoeft op te schonen, kunt u deze verbergen in plaats van verwijderen. Zie Velden verbergen voor meer informatie.
Verwijderen (Veld verwijderen in eerdere versies): Verwijder het veld uit de flow.
Om een waarde te bewerken, klikt u met de rechtermuisknop of Ctrl+Klik (MacOS) op een of meer waarden, selecteert u Waarde bewerken en voert u een nieuwe waarde in. U kunt ook Vervangen door null selecteren om de waarden te vervangen door een null-waarde of dubbelklikken op een enkel veld om het rechtstreeks te bewerken. Zie Veldwaarden bewerken voor meer informatie over het bewerken van veldwaarden.
- Controleer de resultaten van deze bewerkingen in het deelvenster Profiel, het deelvenster Samenvatting of het dataraster.
Veldnamen wijzigen in bulk
Ondersteund in Tableau Prep Builder-versie 2021.2.1 en hoger. Ondersteund in Tableau Prep op internet in Tableau Server en Tableau Cloud-versie 2021.2 en hoger.
Gebruik de optie Veldnamen wijzigen om meerdere veldnamen in bulk te wijzigen. Zoek naar delen van een veldnaam om deze te vervangen of te verwijderen, of voeg voorvoegsels of achtervoegsels toe aan alle of geselecteerde velden in uw dataset.
U kunt dezelfde wijziging ook automatisch toepassen op alle velden die in de toekomst worden toegevoegd en die voldoen aan uw criteria door het selectievakje Nieuwe velden automatisch hernoemen te selecteren wanneer u uw wijzigingen aanbrengt.
Opmerking: Deze optie is alleen beschikbaar in het type Opschoningsstap.
Selecteer in een Opschoningsstap de optie Veldnamen wijzigen in de werkbalk.
Uw weergave wordt automatisch geconverteerd naar de Lijstweergave waarin alle velden in uw flow worden getoond. U kunt de Zoekoptie in de werkbalk gebruiken om uw resultaten te verfijnen.
Alle velden worden standaard geselecteerd. Wis het bovenste selectievakje om de selectie voor alle velden te wissen en handmatig alleen de velden te selecteren die u wilt wijzigen.
- Selecteer een van de volgende opties in het deelvenster Veldnamen wijzigen:
Tekst vervangen: Zoek in het veld Tekst zoeken naar overeenkomende tekst met behulp van de Zoekopties, voer vervolgens de vervangende tekst in het veld Vervangen door in. Om lege ruimtes te zoeken, drukt u op de spatiebalk in het veld Tekst zoeken.
Opmerking: Het wijzigen van veldnamen mag niet resulteren in lege of dubbele veldnamen.
- Voorvoegsel toevoegen: Voeg tekst toe aan het begin van alle geselecteerde veldnamen.
Achtervoegsel toevoegen: Voeg tekst toe aan het einde van alle geselecteerde veldnamen.
Terwijl u uw invoer doorvoert, worden uw resultaten weergegeven in het deelvenster Lijstweergave.
- (optioneel) Selecteer Nieuwe velden automatisch hernoemen om dezelfde wijzigingen automatisch toe te passen op nieuwe velden die voldoen aan uw vervangingscriteria wanneer uw data worden vernieuwd.
Klik op Naam wijzigen om de wijzigingen toe te passen en sluit het deelvenster. De knop Naam wijzigen toont het aantal velden waarop uw wijzigingen van invloed zijn.
Uw wijzigingen bekijken
De verschillende typen opschoonbewerkingen worden weergegeven door pictogrammen boven de stappen in uw flow. Als er meer dan vier typen bewerkingen op een stap worden toegepast, wordt er een ellips boven de stap weergegeven. Wijs deze pictogrammen aan met de muis om aantekeningen te bekijken die de toegepaste bewerkingen tonen en de volgorde waarin ze worden uitgevoerd.
Vanaf Tableau Prep Builder-versie 2019.1.3 en hoger en op internet kunt u op een aantekening klikken op het wijzigingspictogram in een stap in het deelvenster Flow of op een profielkaart in het deelvenster Profiel of Resultaten. De wijziging en het veld waarop deze van invloed is, worden gemarkeerd in het deelvenster Wijzigingen en het deelvenster Profiel of Resultaten.
U kunt ook een stap selecteren en vervolgens het deelvenster Wijzigingen uitklappen om de details van elke wijziging te bekijken, uw wijzigingen te bewerken of te verwijderen, wijzigingen omhoog of omlaag te slepen om de volgorde te wijzigen waarin ze worden toegepast en een beschrijving toevoegen om context te bieden aan andere gebruikers. Zie Beschrijvingen toevoegen aan flowstappen en opschoningsacties(Link wordt in een nieuw venster geopend) voor meer informatie over het toevoegen van beschrijvingen aan uw wijzigingen.
Opschoonaantekening | Deelvenster Wijzigingen |
---|---|
Wanneer u wijzigingen in een stap van Aggregeren, Draaien, Een join maken of Verenigen bekijkt, wordt de volgorde van toepassing van de wijziging getoond vóór of na de vormwijzigingsactie. De volgorde van deze wijzigingen wordt toegepast door het systeem en kan niet worden gewijzigd. U kunt de wijziging bewerken en verwijderen.
Velden samenvoegen
Als u velden hebt die dezelfde waarden bevatten maar een andere naam hebben, kunt u deze eenvoudig samenvoegen tot één veld door het ene veld op het andere te slepen. Wanneer u de velden samenvoegt, wordt het doelveld het primaire veld en blijft de veldnaam van het doelveld behouden. Het veld dat u samenvoegt met het doelveld wordt verwijderd.
Voorbeeld:
Invoerresultaten verenigen in 3 velden met dezelfde waarden | Voeg 3 velden samen tot 1 |
Wanneer u velden samenvoegt, behoudt Tableau Prep alle velden uit het doelveld en vervangt alle null-waarden in dat veld door waarden uit de bronvelden die u samenvoegt met het doelveld. De bronvelden worden verwijderd.
Voorbeeld
Naam | Contact_Phone | Business_Phone | Cell_Phone | Home_Phone |
Bob | 123-4567 | 123-4567 | null | null |
Sally | null | null | 456-7890 | 789-0123 |
Fred | null | null | null | 567-8901 |
Emma | null | 234-5678 | 345-6789 | null |
Als u de velden Business _Phone, Cell_Phone en Home_Phone samenvoegt met het veld Contact_phone, worden de andere velden verwijderd en krijgt u het volgende resultaat:
Naam | Contact_Phone |
Bob | 123-4567 |
Sally | 456-7890 |
Fred | 567-8901 |
Emma | 234-5678 |
Voer een van de volgende handelingen uit om velden samen te voegen:
Sleep één veld naar een ander veld. Een indicator Neerzetten om velden samen te voegen wordt weergegeven.
Selecteer meerdere velden, klik met de rechtermuisknop binnen de selectie om het contextmenu te openen en klik vervolgens op Velden samenvoegen.
Selecteer meerdere velden en klik vervolgens op Velden samenvoegen op de werkbalk.
Zie Niet-overeenkomende velden herstellen voor informatie over het herstellen van niet-overeenkomende velden als gevolg van een vereniging.
Opschoonbewerkingen toepassen met behulp van aanbevelingen
Soms kan het lastig zijn om te bepalen welke opschoonbewerking u moet uitvoeren om problemen in uw data op te lossen. Tableau Prep kan uw data analyseren en opschoonbewerkingen aanbevelen die u automatisch kunt toepassen om snel problemen in uw datavelden op te lossen. Ook kunt u problemen identificeren, zodat u deze kunt oplossen. Deze functie is beschikbaar in alle staptypen, behalve de staptypen Invoeren, Uitvoer en Een join maken.
Opmerking: Als u deze functie niet wilt gebruiken, kunt u deze in Tableau Prep Builder uitschakelen. Ga naar Help > Instellingen en prestaties in het bovenste menu. Klik dan op Aanbevelingen inschakelen om het vinkje naast de instelling te wissen.
Aanbevelingstypen omvatten:
Datarollen
Filter
- Groepswaarden (geldt ook voor velden met datarollen vanaf Tableau Prep Builder-versie 2019.2.3 en op internet)
Kolommen draaien naar rijen (Tableau Prep Builder-versie 2019.4.2 en hoger en op internet)
- Waarden vervangen door null-waarden
Velden verwijderen
Splitsen (Tableau Prep Builder-versie 2019.1.1 en hoger en op internet)
Opmerking: Deze optie werkt specifiek met data in tekstbestanden met een vaste breedte. Om de splitsaanbeveling met dit bestandstype te gebruiken, selecteert u in de invoerstap, nadat u verbinding hebt gemaakt met de databron, in het tabblad Instellingen voor tekst een Veldscheidingsteken dat niet in de data wordt gebruikt, zodat de data als één veld worden geladen.
Spaties verwijderen
Aanbevelingen toepassen
Voer een van de volgende handelingen uit:
- Klik op het gloeilamppictogram in de rechterbovenhoek van de profielkaart.
- Klik in de werkbalk op de vervolgkeuzepijl Aanbevelingen om alle aanbevelingen voor uw dataset te bekijken en selecteer een aanbeveling uit de lijst.
Deze optie wordt alleen weergegeven wanneer aanbevolen wijzigingen door Tableau Prep worden geïdentificeerd.
Beweeg met de muis over de kaart Aanbevelingen en klik op Toepassen om de aanbeveling toe te passen.
De wijziging wordt automatisch toegepast en er wordt een vermelding toegevoegd aan het deelvenster Wijzigingen. Om de wijziging te verwijderen, klikt u op Ongedaan maken in het bovenste menu of beweegt u de muis over de wijziging in het deelvenster Wijzigingen en klikt u op de X om deze te verwijderen.
Als u een aanbeveling toepast op draaivelden, wordt er automatisch een draaistap gemaakt waarin u aanvullende draaiacties kunt uitvoeren, zoals het hernoemen van de gedraaide velden of het draaien op extra velden.
Als Tableau Prep naar aanleiding van de wijziging verdere aanbevelingen identificeert, blijft het gloeilamppictogram op de profielkaart staan totdat er geen verdere aanbevelingen meer worden gevonden.
Herhaal de bovenstaande stappen om eventuele aanvullende wijzigingen door te voeren of negeer de voorgestelde wijziging en gebruik de andere opschoonhulpmiddelen om de dataproblemen op te lossen.
Veldwaarden bewerken
Meerdere variaties van dezelfde waarde kunnen ervoor zorgen dat u uw data niet nauwkeurig kunt samenvatten. Met de volgende opties kunt u deze variaties snel en eenvoudig corrigeren.
Opmerking: Alle bewerkingen die u aanbrengt in de waarden moeten compatibel zijn met het velddatatype.
Een enkelvoudige waarde bewerken
Klik in de Profielkaart op de waarde die u wilt bewerken en voer de nieuwe waarde in. Een groeperingspictogram wordt naast de waarde getoond.
U kunt ook met de rechtermuisknop op een waarde klikken en op Waarde bewerken klikken. De wijziging wordt vastgelegd in het deelvenster Wijzigingen aan de linkerkant van het scherm.
Bekijk de resultaten in het deelvenster Profiel en het dataraster.
Meerdere waarden bewerken
U hebt verschillende opties om meerdere waarden tegelijk te bewerken. Gebruik bijvoorbeeld snelle opschoonbewerkingen om leestekens voor alle waarden in een veld te verwijderen, handmatig waarden te groeperen met behulp van meervoudige selectie, automatisch waarden te groeperen met behulp van gedeeltelijke overeenkomst-algoritmen die vergelijkbare waarden zoeken of meerdere waarden te selecteren en deze te vervangen door null-waarden.
Opmerking: Wanneer u meerdere waarden aan één waarde toewijst, wordt in het oorspronkelijke veld een groeperingspictogram naast de waarde getoond, zodat u kunt zien welke waarden zijn gegroepeerd.
Meerdere waarden bewerken met behulp van snelle opschoonbewerkingen
Deze optie is alleen van toepassing op tekstvelden.
Selecteer in het deelvenster Profiel, het deelvenster Resultaten of het dataraster het veld dat u wilt bewerken.
Klik op Meer opties, selecteer Opschonen en selecteer vervolgens een van de volgende opties:
Hoofdletters maken: Wijzig alle waarden naar tekst in hoofdletters.
Kleine letters maken: Wijzig alle waarden naar tekst in kleine letters.
Titlecase maken: Wijzig alle waarden naar tekst in titlecase.
Letters verwijderen: Verwijder alle letters en laat alleen de overige tekens staan.
Getallen verwijderen: Verwijder alle getallen en laat letters en andere tekens staan.
Leestekens verwijderen: Verwijder alle leestekens.
Spaties verwijderen: Verwijder voorloop- en volgspaties.
- Extra spaties verwijderen: Verwijder de voorloop- en volgspaties en vervang de extra spaties tussen tekens door één spatie.
- Alle spaties verwijderen: Verwijder alle spaties, inclusief de voorloop- en volgspaties en alle spaties tussen tekens.
U kunt bewerkingen stapelen om meerdere opschoonbewerkingen toe te passen op de velden. Selecteer bijvoorbeeld eerst Opschonen > Getallen verwijderen en selecteer daarna Opschonen > Leestekens verwijderen om alle getallen en leestekens uit de veldwaarden te verwijderen.
Om uw wijzigingen ongedaan te maken, klikt u op de pijl Ongedaan maken bovenaan het deelvenster Flow of verwijdert u de wijziging uit de lijst met wijzigingen.
Meerdere waarden inline groeperen en bewerken
Met deze optie kunt u handmatig meerdere waarden selecteren en deze groeperen onder een standaardwaarde in de profielkaart. Zie Meerdere waarden handmatig toewijzen aan een standaardwaarde en Waarden automatisch toewijzen aan een standaardwaarde met behulp van gedeeltelijke overeenkomst om andere methoden te gebruiken voor het groeperen van waarden.
Selecteer in de Profielkaart het veld dat u wilt bewerken.
Houd Ctrl of Shift+Klik of Command of Shift+Klik (MacOS) ingedrukt en selecteer de waarden die u wilt groeperen.
Klik met de rechtermuisknop en selecteer Groeperen in het contextmenu. De waarde in de selectie waarop u met de rechtermuisknop klikt, wordt de standaardnaam voor de nieuwe groep. U kunt deze echter inline bewerken.
Om de groepsnaam te bewerken, selecteert u het gegroepeerde veld en bewerkt u de waarde of klikt u met de rechtermuisknop of Ctrl+Klik (Mac) op het gegroepeerde veld en selecteert u Waarde bewerken in het contextmenu.
Om het groeperen van de gegroepeerde veldwaarden op te heffen, klikt u met de rechtermuisknop op het gegroepeerde veld en selecteert u Groeperen opheffen in het contextmenu.
Een of meer waarden vervangen door null-waarden
Als u datarijen wilt opnemen in uw analyse, maar bepaalde veldwaarden wilt uitsluiten, kunt u deze wijzigen in een null-waarde.
Druk in de Profielkaart op Ctrl of Shift+Klik of Command of Shift+Klik (op Mac) en selecteer de waarden die u wilt wijzigen
Klik met de rechtermuisknop of Ctrl+Klik (Mac) en selecteer Vervangen door null in het menu. De waarden worden gewijzigd in null en het groeperingspictogram wordt naast de waarde getoond.
Meerdere waarden handmatig toewijzen aan een standaardwaarde
Gebruik Waarden groeperen (Groeperen en vervangen in eerdere versies) om de waarde van een veld toe te wijzen van de ene waarde naar de andere waarde of om handmatig meerdere waarden te selecteren om te groeperen. U kunt zelfs nieuwe waarden toevoegen om toewijzingsrelaties in te stellen en zo uw data te ordenen.
Stel bijvoorbeeld dat u drie waarden in een veld hebt: My Company, My Company Incorporated en My Company Inc. Al deze waarden vertegenwoordigen hetzelfde bedrijf, My Company. U kunt Waarden groeperen gebruiken om de waarden My Company Incorporated en My Company Inc toe te wijzen aan My Company, zodat alle drie de waarden als My Company verschijnen in het veld.
Meerdere waarden toewijzen aan één geselecteerd veld
Selecteer in het deelvenster Profiel of het deelvenster Resultaten het veld dat u wilt bewerken.
Klik op Meer opties en selecteer Waarden groeperen (Groeperen en vervangen in eerdere versies) > Handmatige selectie in het menu.
Selecteer in het linkerdeelvenster van de Waarden groeperen-editor de veldwaarde die u wilt gebruiken als groeperingswaarde. Deze waarde wordt nu bovenaan het rechterdeelvenster getoond.
Selecteer in het onderste gedeelte van het rechterdeelvenster in de Waarden groeperen-editor de waarden die u aan de groep wilt toevoegen.
Om waarden uit de groep te verwijderen, wist u in het bovenste gedeelte van het rechterdeelvenster in de Waarden groeperen-editor het selectievakje naast de waarden.
Een groep maken door meerdere waarden te selecteren
Selecteer in het deelvenster Profiel of het deelvenster Resultaten het veld dat u wilt bewerken.
Klik op Meer opties en selecteer Waarden groeperen (Groeperen en vervangen in eerdere versies) > Handmatige selectie in het menu.
Selecteer in het linkerdeelvenster van de Waarden groeperen-editor meerdere waarden die u wilt groeperen.
Klik in het rechterdeelvenster van de Waarden groeperen-editor op Waarden groeperen.
Er wordt een nieuwe groep gemaakt met de laatst geselecteerde waarde als groepsnaam. Om de groepsnaam te bewerken, selecteert u het gegroepeerde veld en bewerkt u de waarde of klikt u met de rechtermuisknop of Ctrl+Klik (MacOS) op het gegroepeerde veld en selecteert u Waarde bewerken in het menu.
Waarden toevoegen en identificeren die niet in de dataset voorkomen
Als u waarden in uw dataset wilt toewijzen aan een nieuwe waarde die niet bestaat, kunt u deze toevoegen met behulp van Waarden groeperen (Groeperen en vervangen in eerdere versies). Om eenvoudig waarden te kunnen identificeren die niet in de dataset voorkomen, worden deze waarden gemarkeerd met een rode stip naast de naam van de waarde in de Waarden groeperen-editor.
In de onderstaande afbeelding staan Wyoming en Nevada bijvoorbeeld niet in de dataset.
Enkele redenen waarom een waarde mogelijk niet in de dataset voorkomt, zijn onder meer:
U hebt de nieuwe waarde zojuist handmatig toegevoegd.
De waarde staat niet meer in de data.
De waarde staat in de data, maar niet in de steekproefdataset.
Om een nieuwe waarde toe te voegen:
Selecteer in het deelvenster Profiel of het deelvenster Resultaten het veld dat u wilt bewerken.
Klik op Meer opties en selecteer Waarden groeperen (Groeperen en vervangen in eerdere versies) > Handmatige selectie in het contextmenu.
Klik in het linkerdeelvenster van de Waarden groeperen-editor op de plus om een nieuwe waarde toe te voegen.
Typ een nieuwe naam in het veld en druk op Enter om deze toe te voegen.
Selecteer in het rechterdeelvenster de waarden die u aan de nieuwe waarde wilt toewijzen.
- (Optioneel) Om extra nieuwe waarden toe te voegen aan uw toegewezen waarde, klikt u op de plusknop in het rechterdeelvenster in de Waarden groeperen-editor.
Waarden automatisch toewijzen aan een standaardwaarde met behulp van gedeeltelijke overeenkomst
Gebruik een van de gedeeltelijke overeenkomst-algoritmen om naar vergelijkbare waarden te zoeken en deze automatisch te groeperen. Veldwaarden worden gegroepeerd onder de waarde die het meest voorkomt. Controleer de gegroepeerde waarden en voeg indien nodig waarden toe aan de groep of verwijder waarden uit de groep.
Als u datarollen gebruikt om uw veldwaarden te valideren, kunt u de optie Waarden groeperen (Groeperen en vervangen in eerdere versies) gebruiken om ongeldige waarden te matchen met geldige waarden. Zie Vergelijkbare waarden groeperen volgens datarol(Link wordt in een nieuw venster geopend) voor meer informatieVergelijkbare waarden groeperen volgens datarol(Link wordt in een nieuw venster geopend)
Kies een van de volgende opties om waarden te groeperen:
Uitspraak: Zoek en groepeer waarden die hetzelfde klinken. Deze optie maakt gebruik van het Metaphone 3-algoritme dat woorden indexeert op basis van hun uitspraak en is het meest geschikt voor Engelse woorden. Dit type algoritme wordt door veel populaire spellingscontroleprogramma's gebruikt. Deze optie is niet beschikbaar voor datarollen.
Veelgebruikte tekens: Zoek en groepeer waarden die letters of cijfers gemeen hebben. Deze optie maakt gebruik van het ngram-vingerafdrukalgoritme dat woorden indexeert op basis van hun unieke tekens nadat leestekens, duplicaten en spaties zijn verwijderd. Dit algoritme werkt voor alle ondersteunde talen. Deze optie is niet beschikbaar voor datarollen.
Dit algoritme zou bijvoorbeeld namen matchen die worden weergegeven als John Smith en Smith, John, omdat ze beide de sleutel hijmnost genereren. Omdat dit algoritme geen rekening houdt met de uitspraak, zou de waarde Tom Jhinois dezelfde sleutel hijmnost hebben en ook in de groep worden opgenomen.
Spelling: Zoek en groepeer tekstwaarden die hetzelfde gespeld zijn. Deze optie maakt gebruik van het Levenshtein-afstandsalgoritme om een bewerkingsafstand tussen twee tekstwaarden te berekenen met behulp van een vaste standaarddrempelwaarde. Wanneer de bewerkingsafstand kleiner is dan de drempelwaarde, worden ze vervolgens gegroepeerd. Dit algoritme werkt voor alle ondersteunde talen.
Vanaf Tableau Prep Builder-versie 2019.2.3 en op internet is deze optie beschikbaar nadat een datarol is toegepast. In dat geval worden de ongeldige waarden gematcht met de dichtstbijzijnde geldige waarde met behulp van de bewerkingsafstand. Als de standaardwaarde niet in uw datasetsteekproef voorkomt, voegt Tableau Prep deze automatisch toe en wordt de waarde gemarkeerd als niet voorkomend in de oorspronkelijke dataset.
Uitspraak + Spelling: (Tableau Prep Builder-versie 2019.1.4 en hoger en op internet) Als u een datarol aan uw velden toewijst, kunt u die datarol gebruiken om waarden te matchen en te groeperen met de standaardwaarde die door uw datarol is gedefinieerd. Met deze optie worden ongeldige waarden gematcht met de meest vergelijkbare geldige waarde op basis van spelling en uitspraak. Als de standaardwaarde niet in uw datasetsteekproef voorkomt, voegt Tableau Prep deze automatisch toe en wordt de waarde gemarkeerd als niet voorkomend in de oorspronkelijke dataset. Deze optie is het meest geschikt voor Engelse woorden.
Zie Data opschonen en vormgevenvoor meer informatie. Wilt u meer lezen over deze gedeeltelijke overeenkomst-algoritmen? Zie Geautomatiseerde groepering in Tableau Prep Builder(Link wordt in een nieuw venster geopend) op Tableau
Opmerking: In Tableau Prep Builder-versie 2019.1.4 en 2019.2.1 werd deze optie gelabeld als Overeenkomsten datarol.
Vergelijkbare waarden groeperen met behulp van gedeeltelijke overeenkomst
Selecteer in het deelvenster Profiel of het deelvenster Resultaten het veld dat u wilt bewerken.
Klik op Meer opties, selecteer Waarden groeperen en selecteer vervolgens een van deze opties:
Uitspraak
Veelgebruikte tekens
Spelling
Tableau Prep Builder zoekt en groepeert waarden die overeenkomen en vervangt deze door de waarde die het vaakst voorkomt in de groep.
Controleer de groeperingen en voeg handmatig waarden toe, verwijder ze of bewerk ze indien nodig. Klik dan op Gereed.
Uw resultaten aanpassen bij het groeperen van veldwaarden
Als u vergelijkbare waarden groepeert op Spelling of Uitspraak, kunt u uw resultaten wijzigen door de schuifregelaar op het veld te gebruiken om aan te passen hoe strikt de groeperingsparameters zijn.
Afhankelijk van hoe u de schuifregelaar instelt, hebt u meer controle over het aantal waarden in een groep en het aantal groepen dat wordt gemaakt. Tableau Prep detecteert standaard de optimale groeperingsinstelling en toont de schuifregelaar in die positie.
Wanneer u de drempelwaarde wijzigt, analyseert Tableau Prep een steekproef van de waarden om de nieuwe groepering te bepalen. De groepen die vanuit de instelling worden gegenereerd, worden opgeslagen en vastgelegd in het deelvenster Wijzigingen, maar de drempelinstelling wordt niet opgeslagen. De volgende keer dat de Waarden groeperen-editor wordt geopend, hetzij door het bewerken van uw bestaande wijziging of door het maken van een nieuwe wijziging, wordt de schuifregelaar voor de drempelwaarde getoond in de standaardpositie, zodat u aanpassingen kunt maken op basis van uw huidige dataset.
Selecteer in het deelvenster Profiel of het deelvenster Resultaten het veld dat u wilt bewerken.
Klik op Meer opties, selecteer Waarden groeperen (Groeperen en vervangen in eerdere versies) en selecteer vervolgens een van deze opties:
Uitspraak
Spelling
Tableau Prep zoekt en groepeert waarden die overeenkomen en vervangt deze door de waarde die het vaakst voorkomt in de groep.
Sleep in het linkerdeelvenster van de Waarden groeperen-editor de schuifregelaar naar een van de 5 drempelwaarden om uw resultaten te wijzigen.
Om een striktere drempelwaarde in te stellen, verplaatst u de schuifregelaar naar links. Hierdoor zijn er minder overeenkomsten en worden er minder groepen gemaakt. Om een lossere drempelwaarde in te stellen, verplaatst u de schuifregelaar naar rechts. Hierdoor ontstaan er meer overeenkomsten en worden er meer groepen gemaakt.
- Klik op Gereed om de wijzigingen op te slaan.