Uw data onderzoeken

Opmerking: vanaf versie 2020.4.1 kunt u flows maken en bewerken in Tableau Server en Tableau Cloud. De inhoud van dit onderwerp is van toepassing op alle platforms, tenzij specifiek anders vermeld. Zie Tableau Prep op het internet in de hulp bij Tableau Server(Link wordt in een nieuw venster geopend) en Tableau Cloud(Link wordt in een nieuw venster geopend) voor meer informatie over authoringsflows op het web.

Gebruik de opties in dit onderwerp om een goed inzicht te krijgen in de samenstelling van uw data. Zo begrijpt u beter welke wijzigingen u moet aanbrengen en wat het effect is van de bewerkingen die u in de flow opneemt.

De datatypen bekijken die aan uw data zijn toegewezen

Net als Tableau Desktop interpreteert Tableau Prep de data in uw velden wanneer u een verbinding sleept naar het deelvenster Flow en hier automatisch een datatype aan toewijst. Omdat verschillende databases data op verschillende manieren kunnen verwerken, is de interpretatie van Tableau Prep mogelijk niet altijd correct.

Om een datatype te wijzigen, klikt u op het pictogram datatype en selecteert u het juiste datatype in het contextmenu. U kunt de datatypen tekenreeks of geheel getal wijzigen in Datum of Datum en tijd en Tableau Prep activeert Auto DateParse om deze datatypen te wijzigen. Als de wijziging niet succesvol is, ziet u net als in Tableau Desktop null-waarden in de velden en kunt u een berekening maken om de wijziging door te voeren.

Zie Een veld converteren naar een datumveld(Link wordt in een nieuw venster geopend) in de Help van Tableau Desktop en Webauthoring voor meer informatie over het gebruik van DateParse.

U kunt het datatype wijzigen in uw invoerstap nadat u verbinding hebt gemaakt met data uit de volgende databronnen:

  • Microsoft Excel
  • Tekstbestanden
  • PDF-bestanden
  • Box
  • Dropbox
  • Google Drive
  • OneDrive

Voeg voor alle andere databronnen een opschoningsstap of een ander staptype toe om deze wijziging door te voeren. Zie Over opschoonbewerkingen voor een lijst met beschikbare opties voor opschonen in de verschillende staptypen.

De details over formaat van uw data bekijken

Nadat u verbinding hebt gemaakt met uw data, voegt u een tabel toe aan de flow en vervolgens een stap. U kunt het deelvenster Profiel gebruiken om de huidige status en structuur van uw data te bekijken en null-waarden en uitschieters te ontdekken.

  • Aantal velden en rijen: in de linkerbovenhoek van het deelvenster Profiel vindt u informatie die het aantal velden en rijen in de data op een bepaald punt in de flow samenvat. Tableau Prep rondt af op het dichtstbijzijnde duizendtal. In het onderstaande voorbeeld bevat de dataset 21 velden en 3.000 rijen.

    Wanneer u de cursor op het aantal velden en rijen plaatst, ziet u het exacte aantal rijen (in dit voorbeeld 2.848).


  • Formaat van de dataset: werk met een subset van uw data door het aantal rijen dat u wilt opnemen op te geven in het tabblad Datasteekproef in het deelvenster Invoer.

  • Steekproef uitgevoerd: om rechtstreeks met uw data te kunnen werken, werkt Tableau Prep met een subset van uw onbewerkte data. Het aantal rijen wordt bepaald door de datatypen en het aantal velden dat wordt weergegeven. Tekenreeksvelden nemen meer opslagruimte in beslag dan gehele getallen. Als u 10 velden met tekenreeksen in uw dataset hebt, krijgt u daarom mogelijk minder rijen dan wanneer u 10 velden met gehele getallen hebt.

    Er wordt een badge Steekproef uitgevoerd weergegeven naast de details over formaat in het deelvenster Profiel om aan te geven dat dit een subset is van uw dataset. U kunt de hoeveelheid data aanpassen die u in uw flow opneemt. Wanneer u flows op internet maakt of bewerkt, gelden er aanvullende datalimieten. Zie Het formaat van uw datasteekproef instellen voor meer informatie.

  • Aantal unieke waarden: het getal naast elke veldkop geeft de afzonderlijke waarden weer die in dat veld zijn opgenomen. Tableau Prep rondt af op het dichtstbijzijnde duizendtal. In het onderstaande voorbeeld zijn er 3.000 verschillende waarden weergegeven in het veld Beschrijving. Als u met de cursor over het getal beweegt, ziet u echter het exacte aantal unieke waarden.



De verdeling van waarden of unieke waarden bekijken

Tableau Prep groepeert numerieke, datum- en datum- en tijdwaarden standaard in een veld in buckets. Deze buckets worden ook wel bins genoemd. Dankzij bins kunt u de verdeling van waarden als geheel bekijken en snel uitschieters en null-waarden identificeren. Het formaat van de bin wordt berekend op basis van de minimum- en maximumwaarden in het veld. Null-waarden worden altijd bovenin de distributie weergegeven.

Zo worden bestel- en verzenddata bijvoorbeeld per jaar samengevat of 'in de bin geplaatst'. Elke bin vertegenwoordigt een jaar, van januari van het beginjaar tot januari van het daaropvolgende jaar, en wordt dienovereenkomstig gelabeld. Omdat er verkoop- en verzenddata zijn die in het laatste deel van 2018 en 2019 vallen, wordt er voor die waarden een bin voor het volgende jaar aangemaakt.

Als een discreet (of categorisch) dataveld veel rijen bevat of een distributie heeft die groot genoeg is om niet in het veld te kunnen worden weergegeven zonder te scrollen, ziet u rechts van het veld een samengevatte distributie. U kunt door de verdeling klikken en scrollen om specifieke waarden te selecteren.

Wanneer uw data numerieke of datumvelden bevatten, kunt u schakelen tussen weergave van de gedetailleerde (discrete) versie van de waarden of een samengevatte (continue) versie van de waarden. In de samengevatte weergave ziet u het bereik van de waarden in een veld en de frequentie waarmee bepaalde waarden verschijnen.

Met deze schakelaar kunt u unieke waarden isoleren (zoals het aantal van '3' records in een veld) of de distributie van waarden (zoals de som van alle '3' records in een veld).

Om uw weergave te wijzigen:

  1. Klik in het deelvenster Profiel, het deelvenster Resultaten of het dataraster op het menu Meer optiesvoor een numeriek of datumveld.

  2. Selecteer in het contextmenu Detail om de gedetailleerde versie van de waarden te zien, of Samenvatting om de gedistribueerde versie van de waarden te zien.

Zoeken naar velden en waarden

In het deelvenster Profiel of Resultaten kunt u zoeken naar velden of waarden die voor u interessant zijn. U kunt de zoekresultaten vervolgens gebruiken om uw data te filteren.

Vanaf versie 2021.1.1 wordt bij het zoeken naar velden een nieuwe indicator weergegeven. Deze geeft aan hoeveel velden er zijn gevonden, zodat u uw zoekresultaten beter kunt begrijpen. Als er geen velden worden gevonden, worden er aanvullende berichten weergegeven.

Om naar velden te zoeken, voert u een volledige of gedeeltelijke zoekterm in het zoekvak op de werkbalk in.

Om naar een waarde in een veld te zoeken:

  1. Klik op het pictogram Zoeken voor een veld en voer een waarde in.

  2. Klik op de knop Zoekopties... om geavanceerde zoekopties te gebruiken.

  3. Om de zoekresultaten te gebruiken om de data te filteren, selecteert u Alleen deze behouden of Uitsluiten.

    In het deelvenster Flow wordt een filterpictogram getoond boven de betreffende stappen.

Veldwaarden kopiëren in het dataraster

Ondersteund in Tableau Prep Builder en Tableau Server versie 2022.3 en later, en in Tableau Cloud versie 2022.2 (augustus) en later.

Kopieer eenvoudig een geselecteerde reeks waarden uit het dataraster en plak deze in elk gewenst document, zoals Microsoft Excel, tekstbestanden (.csv), e-mail en meer. U kunt ze zelfs in de SQL-editor kopiëren en plakken om snel een SQL-query uit te voeren.

  1. Selecteer in het dataraster een of meer veldwaarden die u wilt kopiëren.
  2. Klik met de rechtermuisknop of cmd-klik (MacOS) op de geselecteerde veldwaarden en selecteer Kopiëren uit het menu. U kunt de sneltoetsen Ctrl C of cmd C (MacOS) ook gebruiken of Kopiëren selecteren in het werkbalkmenu ....

  3. Plak de gekopieerde velden in uw document of op uw locatie.

    Opmerking: Bewerken > Kopiëren kopieert momenteel geen veldwaarden uit het dataraster.

Waarden en velden sorteren

Deelvenster Profiel

Met de sorteeropties bij een profielkaart kunt u de bins (het aantal waarden dat wordt weergegeven door de distributiebalken) in oplopende of aflopende volgorde of de afzonderlijke veldwaarden in alfabetische volgorde sorteren.

Dataraster

Sorteer de details op rijniveau voor uw velden in oplopende of aflopende volgorde.

Velden opnieuw ordenen

Het wijzigen van de volgorde van velden met de lijstweergave wordt ondersteund in versie 2022.2.1 en later.

U kunt de volgorde van velden in het deelvenster Profiel, het dataraster of de lijstweergave wijzigen door ze naar een nieuwe positie te slepen en neer te zetten.

Om de volgorde van uw velden te wijzigen:

  1. Selecteer een of meer profielkaarten of velden vanuit het deelvenster Profiel, het deelvenster Resultaten, het dataraster of de weergave Lijst.
  2. Versleep de profielkaart of het veld totdat de zwarte doellijn verschijnt.
  3. Zet de profielkaart of het veld op de juiste plaats.
    Het deelvenster Profiel, het dataraster en de lijstweergave worden gesynchroniseerd, zodat het veld overal in dezelfde volgorde wordt weergegeven. De nieuwe volgorde van de velden blijft behouden in alle Tableau-producten bij het uitvoeren en plannen van flows.

Dataraster opnieuw ordenen

Lijstweergave opnieuw ordenen

Velden en waarden in een flow highlighten

Met Tableau Prep kunt u velden en waarden in uw flowdata eenvoudig vinden. In het deelvenster Flow kunt u nagaan waar een veld vandaan komt en waar het wordt gebruikt in de flow. U kunt ook op afzonderlijke waarden in een profielkaart of in het dataraster klikken om gerelateerde of identieke waarden te highlighten.

Velden in een flow traceren

In Tableau Prep kunt u alle velden highlighten die in een flow worden gebruikt en zelfs de herkomst ervan. Zo kunt u ontbrekende waarden opsporen of problemen met een flow oplossen wanneer u niet de verwachte resultaten ziet.

Klik op een veld in het deelvenster Profiel in een opschoningsstap of in het deelvenster Resultaten in een ander type stap. Het deelvenster Flow past vervolgens een highlight toe op het pad waar dat veld wordt gebruikt.

Opmerking: deze optie is niet beschikbaar voor de staptypen Invoer en Uitvoer.

Gerelateerde waarden bekijken

U kunt highlights gebruiken om gerelateerde waarden in verschillende velden te vinden. Wanneer u op een waarde klikt in de kaart Profiel in het deelvenster Profiel of het deelvenster Resultaten, krijgen alle gerelateerde waarden in de andere velden een blauwe highlight. De blauwe kleur geeft de relatieverdeling weer tussen de door u geselecteerde waarde en de waarden in de andere velden.

Klik bijvoorbeeld in het deelvenster Profiel op een waarde in een veld om gerelateerde waarden te highlighten. De gerelateerde waarden in andere velden worden blauw en het percentage van de balk dat blauw is gehighlight, geeft de mate van koppeling weer.

Highlights voor identieke waarden

Wanneer u een waarde in het dataraster selecteert, worden alle identieke waarden ook gehighlight. Met deze highlights kunt u patronen of onregelmatigheden in uw data identificeren.

Bedankt voor uw feedback.De feedback is verzonden. Dank u wel.