Uw dataset configureren
Opmerking: vanaf versie 2020.4.1 kunt u flows maken en bewerken in Tableau Server en Tableau Cloud. De inhoud van dit onderwerp is van toepassing op alle platforms, tenzij anders aangegeven. Zie Tableau Prep op het web (in het Engels) in de Help van Tableau Server(Link wordt in een nieuw venster geopend) en Tableau Cloud(Link wordt in een nieuw venster geopend) voor meer informatie over ontwerpflows op het web.
Om te bepalen met hoeveel van uw dataset u in de flow wilt werken, kunt u uw dataset configureren. Wanneer u verbinding maakt met uw data of tabellen versleept naar het deelvenster Flow, wordt automatisch een invoerstap aan de flow toegevoegd.
In de invoerstap kunt u bepalen welke en hoeveel data u in uw flow wilt opnemen. Dit is altijd de eerste stap in de flow.
Als u verbonden bent met een Excel- of tekstbestand, kunt u de data ook vernieuwen via de Invoerstap. Zie Meer data toevoegen in de invoerstap(Link wordt in een nieuw venster geopend) voor meer informatie.
In de invoerstap kunt u:
- Klikken met de rechtermuisknop of Cmd-klik (MacOS) op de invoerstap in het deelvenster Flow om de naam te wijzigen of de stap te verwijderen.
- Meerdere bestanden in dezelfde boven- of onderliggende map samenvoegen. Zie Verenigingsbestanden en databasetabellen in de invoerstap voor meer informatie.
- (versie 2023.1 en later) Automatisch gegenereerde rijnummers opnemen op basis van de oorspronkelijke sorteervolgorde van uw dataset. Zie Rijnummers uit uw dataset opnemen.
- Naar velden zoeken.
- Een voorbeeld bekijken van de veldwaarden.
- De veldeigenschappen configureren door de veldnaam te wijzigen of de tekstinstellingen te configureren voor tekstbestanden.
Opmerking: veldwaarden die vierkante haakjes bevatten, worden automatisch omgezet naar gewone haakjes.
- De datasteekproef configureren die in uw flow wordt opgenomen. Zie Het formaat van uw datasteekproef instellen.
- Velden verwijderen die u niet nodig hebt. U kunt altijd teruggaan naar de invoerstap en deze later toevoegen.
- Velden verbergen die u niet hoeft op te schonen, maar die u wel in de uitvoer van uw flow wilt opnemen. U kunt deze op elk gewenst moment weer zichtbaar maken.
- Filters toepassen op geselecteerde velden.
- Het veld Datatype wijzigen voor de dataverbindingen die dit ondersteunen.
- (versie 2023.3 en later) U kunt de koptekst en de beginrij voor .csv-bestanden instellen.
- (versie 2024.1 en later) U kunt de koptekst en de beginrij voor Excel-bestanden instellen.
Rijnummers uit uw dataset opnemen
Ondersteund in Tableau Prep Builder versie 2023.1 en later en op internet voor Microsoft Excel en tekstbestanden (.csv).
Opmerking: deze optie wordt momenteel niet ondersteund voor bestanden die zijn opgenomen in een vereniging voor invoer.
Vanaf versie 2023.1 genereert Tableau Prep automatisch rijnummers op basis van de oorspronkelijke sorteervolgorde van uw data. Deze kunt u als een nieuw veld in uw flow opnemen. Dit is alleen beschikbaar voor Microsoft Excel- of tekstbestanden (.csv).
In eerdere releases moest u deze rijnummers handmatig aan de bron toevoegen voordat u de dataset aan uw flow toevoegde, als u ze wilde opnemen.
Dit veld wordt gegenereerd in de invoerstap wanneer u verbinding maakt met uw data. Standaard is dit uitgesloten van de flow, maar u kunt het met één klik opnemen. Als u ervoor kiest om het op te nemen, gedraagt het zich als elk ander veld en kan het worden gebruikt in uw flowbewerkingen en berekende velden.
Tableau Prep ondersteunt ook de functie ROW_NUMBER voor berekende velden. Deze functie is handig wanneer er velden in uw dataset zijn die de sortering kunnen definiëren, zoals rij-ID of tijdstempel. Zie Berekeningen voor detailniveau, rangschikking en tegels makenvoor meer informatie over het gebruik van deze functie.
Het veld Bronrijnummer toevoegen aan uw flow
Klik met de rechtermuisknop of Cmd-klik (MacOS) op het veld, of klik op het menu Meer opties en selecteer Veld opnemen.
Datavoorbeeld:
Lijst met velden:
De lijst met wijzigingen wordt gewist en het veld maakt nu deel uit van de flowdata. U kunt de gegenereerde rijnummers in de volgende flowstappen zien.
Details van Bronrijnummer
Wanneer u het Bronrijnummer in uw dataset opneemt, zijn de volgende opties en overwegingen van toepassing.
- De rijnummers van de databron worden toegepast vóór eventuele datasteekproeven of filters.
- Dit creëert een nieuw veld met de naam Bronrijnummer dat gedurende de hele flow aanhoudt. Deze veldnaam is niet gelokaliseerd, maar de naam kan op elk moment worden gewijzigd.
- Als er al een veld met deze naam bestaat, wordt de nieuwe veldnaam met 1 verhoogd. Bijvoorbeeld: Bronrijnummer-1, Bronrijnummer-2, enz.
- U kunt het datatype van het veld wijzigen in de volgende stappen.
- U kunt dit veld gebruiken bij flowbewerkingen en berekeningen.
- Deze waarde wordt voor de gehele dataset opnieuw gegenereerd telkens wanneer de invoerdata worden vernieuwd of de flow wordt uitgevoerd.
- Dit veld is niet beschikbaar voor verenigingen bij invoer.
Koptekst en beginrij voor data instellen
Ondersteund in Tableau Prep Builder versie 2023.3 en later en op internet voor tekstbestanden (.csv) en in versie 2024.1 en later voor Excel-bestanden (.xls).
Voor Excel- en tekstbestanden (.csv) kunt u een specifieke rij instellen als veldkoprij en de rij waarin de data beginnen.
Bij het verbinden met Excel- of tekstbestanden is het vaak zo dat de bestanden worden opgemaakt met metadata in de eerste paar rijen, zodat ze leesbaar zijn voor mensen. Tableau Prep interpreteert de eerste rijen van .csv-bestanden standaard als de veldkoprij. Excel-bestanden worden geïnterpreteerd op basis van veldtypen en lege rijen. Tableau Prep kan een rij selecteren als koptekst of geen koptekstrij opnemen.
In het volgende bestand wordt STORE DETAILS
bijvoorbeeld geïnterpreteerd als de koprij.
U kunt de metadata (1) uitsluiten en de juiste schemastructuur voor uw data opgeven door rij 3 in te stellen als de koptekst (2) en rij 4 als de rij waarin de data moeten beginnen.
.Csv-bestanden:
Excel-bestanden:
Hieronder ziet u bijvoorbeeld de standaardinstellingen voor de rijkop en de beginrij:
Hieronder worden de data weergegeven met uitzondering van de metadata:
Opmerking: het Datavoorbeeld geeft geen wijzigingen in de instellingen voor datasteekproeven weer.
De koptekst en beginrij configureren
Met de invoerweergave Datavoorbeeld kunt u de schemastructuur van uw data visueel inspecteren en kopteksten en beginrijen instellen om metadata uit de invoerbrondata uit te sluiten.
U kunt de beginrij van de data instellen op elke waarde die hoger is dan de waarde van de koptekstrij. Tableau Prep stelt de beginrij van de data standaard in op het eerstvolgende nummer na de koptekstrij. Alle rijen tussen de koprij en de beginrij van de data worden genegeerd.
Opmerking: Datavoorbeeld en Data Interpreter sluiten elkaar uit. Data Interpreter detecteert alleen subtabellen in uw Excel-spreadsheets en biedt geen ondersteuning voor het opgeven van de beginrij voor tekstbestanden en spreadsheets.
- Selecteer de invoerstap.
- Klik in de werkbalk op de invoerweergave Datavoorbeeld.
- Klik op de rij die u als koptekst wilt instellen op het menu Meer opties en selecteer Instellen als koptekst.
- Klik in de rij die u wilt instellen als startrij voor data op het menu Meer opties en selecteer Instellen als begin van data. Standaard wordt de beginrij van de data ingesteld op het eerstvolgende rijnummer.
In het menu Opties voor koptekst worden de koptekstrij en het rijnummer voor de Beginrij met data weergegeven. U kunt de koptekst en de beginrij optioneel rechtstreeks in het dialoogvenster Opties voor koptekst instellen.
Meerdere schema's in één bestand
Als één bestand meerdere databronnen bevat, kunt u een extra invoerstap maken door verbinding te maken met dezelfde databron. Vervolgens stelt u de koptekst en de beginrijen voor de data in voor de tweede databron. Het volgende bestand bevat bijvoorbeeld een databron die begint in regelnummer 3 (1) met een ander, afzonderlijk tweede schema dat begint in rijnummer 28 (2).
Voor dit type databron volgt u deze stappen.
- Selecteer de eerste invoerstap.
- Klik in de werkbalk op de invoerweergave Datavoorbeeld.
- Klik in de rij die u als koptekst wilt instellen op het menu Meer opties en selecteer Instellen als koptekst.
- Klik in de rij die u wilt instellen als startrij voor data op Meer opties en selecteer Instellen als begin van data. Standaard wordt de beginrij van de data ingesteld op het eerstvolgende rijnummer.
- Selecteer de volgende invoerstap.
- Herhaal de bovenstaande stappen om de koptekst en de beginrij in te stellen voor extra databronnen.
Alle rijen tussen de koprij en de beginrij van de data worden genegeerd.
Meerdere tabellen verenigen
Ondersteund in Tableau Prep Builder versie 2024.1 en later en op het web voor tekstbestanden (.csv).
U kunt meerdere tabellen samenvoegen uit databronnen die dezelfde schemastructuur en metadatarij hebben.
- Maak verbinding met de bestanden en selecteer de eerste invoerstap.
- Klik in de werkbalk op de invoerweergave Datavoorbeeld.
- Klik in de rij die u als koptekst wilt instellen op Meer opties en selecteer Instellen als koptekst.
- Klik in de rij die u wilt instellen als startrij voor data op Meer opties en selecteer Instellen als begin van data.
- Klik op het tabblad Tabellen en selecteer Meerdere tabellen verenigen.
- Klik op Toepassen om de bestanden te verenigen en de kop- en rijselectie voor alle bestanden in de vereniging voor invoer te behouden. Hierbij wordt ervan uitgegaan dat de bestandsstructuur en het schema in alle samengevoegde invoerbestanden hetzelfde zijn.
Verbinding maken met een aangepaste SQL-query
Als uw database het gebruik van aangepaste SQL ondersteunt, ziet u Aangepaste SQL weergegeven onderin het deelvenster Verbindingen. Dubbelklik op Aangepaste SQL om het tabblad Aangepaste SQL te openen. Hier kunt u query's invoeren om data vooraf te selecteren en bronspecifieke bewerkingen uit te voeren. Nadat de query de dataset heeft opgehaald, kunt u de velden selecteren die u wilt opnemen, filters toepassen of het datatype wijzigen voordat u de data aan uw flow toevoegt.
Zie Aangepaste SQL gebruiken om verbinding te maken met data voor meer informatie over het gebruik van aangepaste SQL.
Opschoonbewerkingen toepassen toepassen in een invoerstap
Er zijn slechts enkele opschoonbewerkingen beschikbaar in een invoerstap. U kunt de volgende wijzigingen aanbrengen in de lijst Invoerveld. Uw wijzigingen worden bijgehouden in het deelvenster Wijzigingen en aantekeningen worden toegevoegd aan de linkerkant van de invoerstap in het deelvenster Flow en in de lijst Invoerveld.
- Veld verbergen: verberg velden in plaats van ze te verwijderen, zodat uw flow overzichtelijker wordt. U kunt ze altijd weer zichtbaar maken als u ze nodig hebt. Verborgen velden worden nog steeds opgenomen in uw invoer wanneer u uw flow uitvoert.
- Filteren: gebruik de berekeningseditor om waarden te filteren. Vanaf versie 2023.1 kunt u ook het dialoogvenster Relatieve-datumfilter gebruiken om snel datumbereiken voor datum- of datum- en tijdvelden op te geven.
- Veldnaam wijzigen: dubbelklik in het Veldnaam of Ctrl-klik (MacOS) op de veldnaam en voer een nieuwe veldnaam in.
- Datatype wijzigen: klik op het datatype voor het veld en selecteer een nieuw datatype uit het menu. Deze optie wordt momenteel ondersteund voor Microsoft Excel, tekst- en PDF-bestanden, Box, Dropbox, Google Drive en OneDrive-databronnen. Alle andere databronnen kunnen in één opschoonstap worden gewijzigd.
Velden selecteren om op te nemen in de flow
Opmerking: vanaf versie 2023.1 kunt u meerdere velden selecteren om ze te verbergen, weer te geven, te verwijderen of op te nemen. In eerdere versies kon u met één veld tegelijk werken en de selectievakjes in- of uitschakelen om velden toe te voegen of te verwijderen.
In het deelvenster Invoer ziet u een lijst met velden in uw dataset. Standaard zijn alle velden opgenomen, behalve het automatisch gegenereerde veld Bronrijnummer. Gebruik de weergave Datavoorbeeld of de Lijstweergave om uw velden te beheren.
- Zoeken: velden zoeken.
- Velden verbergen: verberg velden die u in uw flowuitvoer wilt opnemen, maar die u niet hoeft op te schonen.
- Klik in de veldenlijst op het pictogram met het oogje of selecteer Velden verbergen uit het menu Meer opties.
- Selecteer in het Datavoorbeeld Velden verbergen uit het menu Meer opties.
Velden worden tijdens de looptijd door de flow verwerkt. U kunt velden ook op elk gewenst moment Weergeven als u ze nodig hebt. Zie Velden verbergen(Link wordt in een nieuw venster geopend) voor meer informatie.
- Velden opnemen: velden toevoegen aan uw flow die als verwijderd zijn gemarkeerd.
- Selecteer in de Lijst met velden een of meer rijen en klik met de rechtermuisknop, of houd Cmd ingedrukt en klik (MacOS), of klik op het menu Meer opties en selecteer Veld(en) opnemen om velden weer toe te voegen die als verwijderd zijn gemarkeerd.
- Klik in het Datavoorbeeld op het menu Meer opties en dan in het veld dat u in uw flow wilt opnemen en selecteer Veld opnemen.
- Velden verwijderen:
- Selecteer in de Lijst met velden een of meer rijen en klik met de rechtermuisknop, of houd Cmd ingedrukt en klik (MacOS), klik op de ‘X’ of klik op het menu Meer opties en selecteer dan Velden verwijderen om velden te verwijderen die u niet in de flow wilt opnemen.
- Klik in het Datavoorbeeld op het menu Meer opties en dan op het veld dat u wilt verwijderen en selecteer Veld verwijderen.
Filters toepassen op velden in de invoerstap
Pas filters in de invoerstap toe om de hoeveelheid data te verminderen die u uit uw databronnen opneemt. U kunt interactieve prestaties efficiënter maken en een bruikbaarder datasteekproef verkrijgen door de data te verwijderen die u niet wilt verwerken wanneer u de flow uitvoert.
In de invoerstap kunt u filters toepassen met behulp van de Editor berekeningen. Vanaf versie 2023.1 kunt u ook het dialoogvenster Relatieve-datumfilter gebruiken om een exact datumbereik van waarden op te geven voor de veldtypen Datum en Datum en tijd. Zie ‘Relatieve-datumfilter’ in Uw data filteren(Link wordt in een nieuw venster geopend) voor meer informatie.
U kunt andere filteropties gebruiken in de stap Opschonen of andere staptypen. Zie Uw data filteren(Link wordt in een nieuw venster geopend) voor meer informatie.
Een berekeningsfilter toepassen
- Klik in de werkbalk op Waarden filteren. Gebruik een van de volgende methoden om uw data te filteren:
Klik in de veldenlijst op het menu Meer optiesen dan op de naam van het veld en selecteer Filteren > Berekening ....
Klik in het Datavoorbeeld op het menu Meer opties vanuit de naam van het veld en selecteer dan Filteren > Berekening ....
Voer uw filtercriteria in de Editor berekeningen in.
Een relatieve-datumfilter toepassen
- Selecteer een veld met het datatype Datum of Datum en tijd en gebruik een van de volgende methoden om een relatief-datumfilter toe te passen.
- Klik met de rechtermuisknop in de veldenlijst, of houd Cmd ingedrukt en klik (MacOS), of klik op het menu Meer opties vanuit de kolom Veldnaam en selecteer Filteren > Relatieve datums.
- Klik in het Datavoorbeeld op het menu Meer opties vanuit het veld en selecteer Filteren > Relatieve datums.
Geef in het dialoogvenster Relatieve-datumfilter het exacte bereik op van jaren, kwartalen, maanden, weken of dagen dat u in uw flow wilt opnemen. U kunt ook een anker configureren ten opzichte van een specifieke datum en zo null-waarden opnemen.
Opmerking: standaard werkt het filter relatief ten opzichte van de datum waarop de flow wordt uitgevoerd of als voorbeeld wordt bekeken in de ervaring bij authoring.
Veldnamen wijzigen
Gebruik een van de volgende methoden om de naam van een veld te wijzigen.
Er wordt een aantekening toegevoegd in het veldraster en in het deelvenster Flow links van de invoerstap. Uw wijzigingen worden ook bijgehouden in het deelvenster Wijzigingen.
- Selecteer in de Lijst met velden een veld in de kolom Veldnaam en klik op Veldnaam wijzigen. Typ de nieuwe naam in het veld in.
- Selecteer in het Datavoorbeeld een veld en klik dan op Veldnaam wijzigen. Typ de nieuwe naam in het veld in.
Datatypen wijzigen
Momenteel worden Microsoft Excel, tekst- en PDF-bestanden, Box, Dropbox, Google Drive en OneDrive-databronnen ondersteund. Alle andere databronnen kunnen in één opschoonstap worden gewijzigd.
Opmerking: het datatype voor Bronrijnummer (versie 2023.1 en later) kan alleen worden gewijzigd in een Opschoningsstap of een ander staptype.
Om het dataype voor een veld te wijzigen, doet u het volgende:
- Klik op het datatype voor het veld.
- Selecteer het nieuwe datatype in het menu.
- Datavoorbeeld:
- Veldweergave:
U kunt het datatype voor velden ook in andere staptypen in de flow wijzigen of datarollen toewijzen om uw veldwaarden te valideren. Zie De datatypen bekijken die aan uw data zijn toegewezen(Link wordt in een nieuw venster geopend) en Datarollen gebruiken om uw data te valideren(Link wordt in een nieuw venster geopend) voor meer informatie over het wijzigen van uw datatype of het gebruik van datarollen.
Veldeigenschappen configureren
Wanneer u met tekstbestanden werkt, ziet u een tabblad Instellingen. Hier kunt uw verbinding bewerken en teksteigenschappen configureren, zoals de veldscheidingstekens voor tekstbestanden. U kunt de verbinding van het bestand ook bewerken in het deelvenster Verbindingen of Instellingen voor incrementele vernieuwing configureren. Zie Flowdata vernieuwen met incrementele vernieuwing voor meer informatie over het instellen van incrementele vernieuwing voor uw flow.
Wanneer u met tekst- of Excel-bestanden werkt, kunt u datatypen corrigeren die onjuist zijn afgeleid. Dit kan nog voordat u de flow start. Datatypen kunnen altijd worden gewijzigd in de volgende stappen in het deelvenster Profiel nadat u uw flow start.
Tekstinstellingen configureren in tekstbestanden
Om de instellingen voor het parseren van tekstbestanden te wijzigen, selecteert u een van de volgende opties:
Eerste regel bevat koptekst (standaard): selecteer deze optie om de eerste rij als veldlabels te gebruiken.
Automatisch veldnamen genereren: selecteer deze optie als u wilt dat Tableau Prep Builder de veldkoppen automatisch genereert. De conventie voor naamgeving voor velden volgt hetzelfde model als in Tableau Desktop. Bijvoorbeeld F1, F2, enz.
Veldscheidingsteken: selecteer een teken uit de lijst om de kolommen te scheiden. Selecteer Overige om een eigen teken in te voeren.
Tekstkwalificatie: selecteer het teken dat de waarden in het bestand omsluit.
Tekenset: selecteer de tekenset die de codering van het tekstbestand beschrijft.
Landinstelling: selecteer de landinstellingen die u wilt gebruiken om het bestand te parseren. Deze instelling geeft aan welk scheidingsteken voor decimale waarden en duizendtallen moet worden gebruikt.
Het formaat van uw datasteekproef instellen
Gestratificeerde rijselectie wordt ondersteund in Tableau Prep Builder versie 2023.3 en later.
Tableau Prep bepaalt standaard het maximale aantal rijen dat nodig is om data voor een representatieve steekproef van uw dataset effectief te verkennen en voor te bereiden. Op basis van het voorbeeldalgoritme van Tableau Prep geldt: hoe meer velden uw invoerdata bevatten, hoe kleiner het aantal toegestane rijen. Wanneer steekproeven worden uitgevoerd voor data, kan het resulterende monster wel of niet alle rijen bevatten die u nodig hebt, afhankelijk van hoe de steekproef is berekend en geretourneerd. Tableau Prep gebruikt bijvoorbeeld standaard de methode Snel selecteren om steekproeven uit te voeren voor data. Bij deze methode worden de bovenste rijen geladen. Als uw dataset groot is en de data chronologisch zijn gestructureerd, ziet u mogelijk wel uw vroegste data waarvoor een steekproef is uitgevoerd, maar geen volledige weergave van alle data. Als u de verwachte data niet ziet, kunt u de instellingen voor de datasteekproef wijzigen om de query opnieuw uit te voeren.
Bij het maken of bewerken van flows met Webauthoring configureert de beheerder het maximale aantal rijen dat een gebruiker kan selecteren bij gebruik van grote datasets. Zie Voorbeelddata en verwerkingslimieten in de Help bij Tableau Server(Link wordt in een nieuw venster geopend) of Tableau Cloud(Link wordt in een nieuw venster geopend) voor meer informatie.
Uw data voorbereiden op steekproeven
Als u weet dat bepaalde waarden niet vereist zijn voor uw analyse, verwijdert u de velden in de invoerstap. Dan worden de data niet opgenomen wanneer u uw flow maakt of uitvoert.
Als u een grote dataset hebt die steekproeven activeert, kunt u door velden in de invoerstap te verwijderen het aantal rijen verhogen dat Tableau Prep laadt. Wanneer geen steekproeven worden uitgevoerd, wordt door het verwijderen van velden in de invoerstap het datavolume verminderd dat Tableau Prep laadt.
Nadat u onnodige velden en waarden uit de dataset hebt verwijderd, kunt u de hoeveelheid data wijzigen die voor steekproeven wordt geladen of de bemonsteringsmethode wijzigen.
De instellingen voor de datasteekproef wijzigen
Steekproefdata dragen bij aan de interactieve ervaring en zorgen dat u de flow efficiënter kunt bewerken, vergeleken met het profileren van alle data en het toepassen van wijzigingen op grotere datasets terwijl u werkt. Alle data worden gebruikt wanneer u de flow uitvoert. Alle wijzigingen die u in het voorbeeldgedeelte aanbrengt, worden toegepast op de huidige flow.
Om uw data te valideren nadat u ze hebt opgeschoond en vormgegeven, voert u de flow uit en bekijkt u de uitvoer in Tableau Desktop.
Opmerking: voer de volledige flow uit in plaats van 'voorbeeld bekijken in Tableau Desktop', zodat u al uw data kunt zien. Als u onverwachte of onjuiste waarden ziet die niet in de steekproef zaten, kunt u teruggaan naar Tableau Prep om dit op te lossen.
- Verwijder onnodige velden en waarden uit de dataset.
- Selecteer een invoerstap en klik vervolgens op het tabblad Datasteekproef.
Selecteer het aantal rijen dat u wilt laden voor datasteekproeven. Het aantal rijen dat u kiest, heeft invloed op de prestaties.
- Automatisch: (standaard) laadt data snel en berekent het aantal rijen automatisch, zodat er voldoende data zijn voor een steekproef. Het aantal rijen dat wordt geladen, is gelijk aan of lager dan 393.216.
Opgeven: wordt meestal gebruikt om een klein aantal rijen te laden, zodat u de structuur van de data kunt begrijpen en snelle laadtijden hebt. Geef een aantal rijen op dat kleiner is dan 1 miljoen.
Let op: bij webauthoring: het maximale aantal rijen dat een gebruiker kan selecteren bij het gebruik van grote datasets, wordt door de beheerder geconfigureerd. Als gebruiker kunt u het aantal rijen tot aan deze limiet selecteren.
- Maximaal: laadt zoveel mogelijk data voor rijselectie. Deze is gelijk aan of kleiner dan 1.048.576. Zorg dat u de Hoge prestatievereisten hebt voor grote datasets.
Selecteer de methode die moet worden gebruikt voor het aantal rijen dat voor steekproeven wordt geretourneerd. Wanneer u Willekeurig of Gestratificeerd kiest, kan dit invloed hebben op de prestaties.
Opmerking: rijselectie wordt alleen ondersteund als uw invoerdatabron willekeurige steekproeven ondersteunt. Als uw databron geen willekeurige steekproeven ondersteunt, wordt de standaardmethode Snelle selectie gebruikt.
Snel selecteren: (standaard) voert steekproeven uit voor data op basis van prestaties, omdat de rijen zo snel mogelijk worden geretourneerd. Sommige rijen worden mogelijk niet in de steekproef opgenomen. De rijen die voor de bemonstering worden gebruikt, kunnen de eerste N rijen zijn of de rijen die de database in het geheugen heeft opgeslagen van een eerdere query. Hoewel dit bijna altijd een sneller resultaat oplevert dan willekeurige steekproeven, kan het wel een bevooroordeelde steekproef opleveren (bijvoorbeeld data van slechts één jaar in plaats van alle jaren die in de data voorkomen, als de data chronologisch worden gesorteerd).
Willekeurig: hiermee kunt u een steekproef uitvoeren voor grote datasets en een algemene weergave van de volledige selectie rijen retourneren. Tableau Prep retourneert willekeurige rijen op basis van alle geselecteerde geladen rijen. Deze optie kan van invloed zijn op de prestaties wanneer de data voor het eerst worden opgehaald.
- Gestratificeerd: hiermee kunt u groeperen op een bepaald veld en vervolgens steekproeven uitvoeren voor data binnen elke subgroep. Prep retourneert het gevraagde aantal rijen, verdeeld over het geselecteerde veld, zodat de groepering zo gelijkmatig mogelijk verloopt. In sommige gevallen kan dit, afhankelijk van de databron, ertoe leiden dat bepaalde waarden voor het veld meer rijen bevatten dan andere.
Voorbeelden
Deze voorbeelden zijn gebaseerd op de wereldwijde dataset met indicatoren die is meegeleverd met Tableau Prep. Het eerste voorbeeld gebruikt Automatisch voor het aantal rijen en Willekeurig voor de steekproefmethode of het aantal rijen dat voor de steekproef moet worden geretourneerd.
Nadat deze waarden zijn geselecteerd, worden er willekeurig 3.000 rijen geselecteerd en gebruikt om de volledige dataset weer te geven.
Het tweede voorbeeld gebruikt Opgeven voor het aantal rijen en Gestratificeerd voor de steekproefmethode. Het opgegeven aantal rijen wordt ingesteld op een waarde van 7 en het veld Geboortecijfer wordt gebruikt voor groepering.
De nieuwe steekproefwaarden tonen een uniforme verdeling van 7 rijen met unieke waarden over alle velden.