Een veld opsplitsen in meerdere velden
Als uw data tekenreeksvelden bevatten met meerdere afzonderlijke stukjes informatie (bijv. de voor- en achternaam van een klant), kunt u de waarden mogelijk opsplitsen in afzonderlijke velden.
In Tableau Desktop kunt u opties voor splitsen gebruiken om waarden te scheiden op basis van een scheidingsteken of een herhaald patroon van waarden die in elke rij aanwezig zijn. In het voorbeeld van Customer Name is het algemene scheidingsteken een spatie (‘ ’) tussen de voor- en achternaam.
Optie Zoek de spliting
Tableau Desktop, maar niet webbewerking in browsers, bevat een menuoptie voor automatische of aangepaste splitsingen. Deze is gebaseerd op de tekenreeksfunctie SPLIT. Deze kan ook handmatig in een berekening worden gebruikt voor volledige controle over de splitsing.
Niet alle databronnen ondersteunen SPLIT. U kunt zien of uw data de SPLIT-functie ondersteunen door de menuopties Splitsen en Aangepast splitsen aan te vinken:
Controleer op de pagina Databron het menu voor Splitsen en Aangepast splitsen.
Controleer in het deelvenster Data op een werkblad het menu voor Transformeren > Splitsen en Aangepast splitsen.
Splitsen op het web
Webauthoring ondersteunt het splitsen vanuit een menu niet. Om data te splitsen terwijl u in de browser werkt, kunt u handmatig een SPLIT-berekening maken. Zie Alternatieven voor splitsen vanuit het menu.
Gesplitste velden
Een tekenreeksveld kan automatisch worden gesplitst op basis van een gemeenschappelijk scheidingsteken dat Tableau in het veld detecteert. U kunt de splitsing ook handmatig definiëren
Afhankelijk van het verbindingstype kunnen bij een splitsing de waarden van een veld automatisch worden gesplitst in maximaal tien nieuwe velden.
Een veld automatisch splitsen
Klik op de pagina Databron in het raster op de vervolgkeuzepijl naast de veldnaam en selecteer vervolgens Splitsen.
Klik in het deelvenster Data met de rechtermuisknop op het veld dat u wilt splitsen en selecteer vervolgens Transformeren > Splitsen.
De resultaten van de splitsing zijn standaard berekende velden die u net als elk ander berekend veld kunt bewerken of verwijderen. Het datatype van de nieuwe velden die door de splitsing worden gegenereerd, kan variëren, afhankelijk van de patrooncombinatie die Tableau detecteert.
Een veld splitsen met aangepast splitsen
Gebruik de optie 'Aangepast splitsen' voor meer controle over de splitsing. U kunt het scheidingsteken opgeven en de waarden splitsen bij de eerste N keer dat het scheidingsteken voorkomt, de laatste N keer dat het scheidingsteken voorkomt of bij alle keren dat het scheidingsteken voorkomt.
Klik op de pagina Databron in het raster op de vervolgkeuzepijl naast de veldnaam. Selecteer Aangepast splitsen.
Klik vanuit het deelvenster Data met de rechtermuisknop op het veld dat u wilt splitsen en selecteer vervolgens Transformeren > Aangepast splitsen.
De nieuwe velden die door de aangepaste splitsing worden gegenereerd, resulteren altijd in het datatype tekenreeks.
Opmerking: in sommige gevallen wordt het dialoogvenster Aangepast splitsen weergegeven als het genereren van nieuwe velden door de automatische splitsing te lang duurt of als Tableau geen gemeenschappelijk scheidingsteken kan vinden.
Aangepast splitsen is handig wanneer het aantal scheidingstekens per waarde verschilt. In deze gevallen kan automatisch splitsen niet worden gebruikt.
Stel bijvoorbeeld dat het veld Employee Info de volgende waarden bevatt:
- jsmith| accounting | north
- dnguyen | humanresources
- lscott | recruiting| west
- karnold |recruiting |west
De aangepaste splitsing kan zodanigen geconfigureerd dat er wordt gesplitst op het pijpteken (‘|’) en dat alle kolommen worden afgesplitst. Voor de waarde zonder regio is het derde resultaatveld voor die rij null (nietig).
Alternatieven voor splitsen vanuit het menu
Handmatig splitsen met de SPLIT-functie
De SPLIT-functie werkt op een vergelijkbare manier als een aangepaste splitsing. Maar er wordt slechts één resultaatveld per berekening geretourneerd. U definieert het scheidingsteken en geeft aan welke waarde moet worden geretourneerd door een tokennummer op te geven.
Om bijvoorbeeld Customer Name te splitsen in First en Last Name, maakt u twee berekende velden:
- First Name:
SPLIT([Customer Name], " ", 1)
- Last Name:
SPLIT([Customer Name], " ", 2)
Het voorbeeld met Employee Info (zoals ‘jsmith| accounting | north’) zou drie berekende velden gebruiken:
- Username:
SPLIT([Employee Info], |, 1)
- Department:
SPLIT([Employee Info], |, 2)
- Region:
SPLIT([Employee Info], |, 3)
Zie de SPLIT-functie voor meer informatie.
Handmatig splitsen met de functies LEFT en RIGHT
Als u een specifiek deel van een tekenreeks wilt extraheren in plaats van deze te splitsen op basis van een scheidingsteken, kunt u de functies LEFT en RIGHT gebruiken. Deze retourneren alleen een deel van de tekenreeks op basis van een opgegeven aantal tekens.
Als de waarde van een rij bijvoorbeeld IGW8892 is:
Berekening | Resultaat |
RIGHT([Value], 4) | 8892 |
LEFT([Value], 4) | IGW8 |
LEFT(RIGHT([Value], 2) , 1) | 9 |
Zie LEFT en RIGHT in Tekenreeksfuncties voor meer informatie.
Gebruik reguliere expressies voor velden die gemengde scheidingstekens bevatten
Velden kunnen niet automatisch worden gesplitst als de scheidingstypen verschillend zijn. Stel bijvoorbeeld dat het veld de volgende waarden bevatt:
- smith.accounting
- dnguyen-humanresources
- lscott_recruiting
- karnold_recruiting
In dergelijke gevallen kunt u overwegen om reguliere expressies te gebruiken om de gewenste informatie te extraheren. Zie Aanvullende functies voor meer informatie.
Werken met splitsingen en aangepaste splitsingen
Waar u op moet letten bij het werken met splitsingen en aangepaste splitsingen.
Nieuwe velden kunnen niet worden gebruikt als sleutels om tabellen samen te voegen, maar kunnen wel worden gebruikt om databronnen te mengen.
Nieuwe velden kunnen niet worden gebruikt een draaipuntdiagram.
Opties voor Splitsen en Aangepast splitsen worden niet ondersteund voor sets, groepen, parameters en bins.
Microsoft SQL Server staat maximaal vier gesplitste velden toe.
Als u meer dan tien nieuwe velden wilt genereren, kunt u overwegen om meerdere keren te splitsen. U kunt splitsen nogmaals gebruiken voor een veld uit de eerste splitsing dat nog steeds meerdere stukjes informatie bevat.
Problemen met splitsingen en aangepaste splitsingen oplossen
Bekende problemen die u kunt ondervinden bij het gebruik van splitsingen en aangepaste splitsingen:
Opties voor splitsen en aangepast splitsen ontbreken voor een ondersteund databrontype: opties voor splitsen en aangepast splitsen zijn alleen beschikbaar voor velden met het datatype tekenreeks.
Null-waarden: nadat u een splitsing of een aangepaste splitsing hebt gemaakt, kunnen nieuwe velden null-waarden of helemaal geen waarden bevatten. Null-waarden of lege cellen ontstaan wanneer er geen waarden zijn voor de verwachte nieuwe velden.
Data zijn verwijderd: Tableau kan delen van de veldwaarden als scheidingsteken gebruiken. Als een deel van de waarde van een veld als scheidingsteken wordt gebruikt, worden die waarden niet meer in de nieuwe velden weergegeven.
Bijvoorbeeld:
Oorspronkelijke waarde | Waarden van gesplitste velden |
Zip-98102 | 98102 |
Zip-98109 | 98109 |
Zip-98119 | 98199 |
Zip-98195 | 98195 |
Bij het splitsen wordt er geen apart veld voor 'Zip-' aangemaakt, omdat die hele tekenreeks als scheidingsteken wordt gebruikt.