Typen uitleg in Data uitleggen
Elke keer dat u een nieuwe markering selecteert in een visualisatie of dashboard en Data uitleggen uitvoert, voert Tableau een nieuwe statistische analyse uit op basis van die markering en de onderliggende data in de werkmap. Mogelijke verklaringen worden weergegeven in uitvouwbare secties voor het deelvenster Datagids. Zie Hoe Data uitleggen werkt voor informatie over hoe Data uitleggen uitleg analyseert en evalueert.
Onderliggende waarden verkennen
In deze sectie wordt uitleg gegeven voor elke maatregel die verklaard kan worden (aangeduid als doelmeetwaarden). Elke hier vermelde uitleg beschrijft een relatie met de waarden van de doelmeetwaarde die op de geanalyseerde markering worden getest. Gebruik uw praktische kennis van de data om te bepalen of de relaties die Data uitleggen heeft gevonden, zinvol zijn en de moeite waard zijn om te verkennen.
Onderliggende kenmerken
In de uitleg wordt beschreven hoe onderliggende records van de markeringen in de weergave kunnen bijdragen aan de geaggregeerde waarde van de meetwaarde die wordt toegelicht. Markeringskenmerken kunnen de extreme waarden, de nullwaarden, het aantal records of de gemiddelde waarde van de markering omvatten.
Opmerking: zie Termen en concepten in uitleg(Link wordt in een nieuw venster geopend) voor definities van veelgebruikte termen in een uitleg.
Extreme waarden
Dit type uitleg geeft aan of een of meerdere records waarden hebben die aanzienlijk hoger of lager zijn dan de meeste records. Als de verklaring door een model wordt ondersteund, geeft dit aan dat de extreme waarde de doelmeetwaarde van de geanalyseerde markering beïnvloedt.
Wanneer een markering extreme waarden heeft, betekent dit niet automatisch dat er ook uitschieters zijn of dat u die records uit de weergave moet weglaten. Die keuze is aan u en is afhankelijk van uw analyse. De uitleg geeft eenvoudigweg een extreme waarde aan in de markering. Het kan bijvoorbeeld voorkomen dat een foutief ingevoerde waarde in een record wordt aangetroffen, waarbij een banaan 10 euro kost in plaats van 10 cent. Of er kan staan dat een bepaalde verkoper een goed kwartaal heeft gehad.
Opmerking: deze uitleg moet door de auteur worden ingeschakeld om zichtbaar te zijn in de weergavemodus voor een gepubliceerde werkmap. Zie Toegang tot Data uitleggen beheren voor meer informatie.
Deze uitleg laat het volgende zien:
Verkenningsopties:
Volgende stappen voor analyse:
| In dit voorbeeld draagt een enkele extreme waarde van 463 huururen bij aan de hoger dan verwachte som van een totale huurtijd van 613 uur. Een waarschijnlijke reden voor deze hoge waarde zou kunnen zijn dat iemand is vergeten de fiets in het dock te plaatsen toen deze werd teruggebracht. In dat geval kan het zijn dat de auteur deze waarde wil uitsluiten voor toekomstige analyses.
| |
Het verschil visualiserenIn deze sectie ziet u het volgende:
Verkenningsopties:
Volgende stappen voor analyse:
| In dit voorbeeld is de geanalyseerde markering niet meer zo hoog vergeleken met andere markeringen in de weergave wanneer de extreme waarde van 483 wordt uitgesloten. Andere kenmerken vallen nu op. De auteur zou de andere locaties eens nader kunnen bekijken om te achterhalen waarom deze locaties een hoger aantal uur hebben voor fietsverhuur. |
Nullwaarden
Het type uitleg Nullwaarden geeft situaties aan waarin er een hogere hoeveelheid ontbrekende data in een markering is dan verwacht. Het geeft aan welk deel van de doelmeetwaarden null is en hoe de nullwaarden mogelijk bijdragen aan de geaggregeerde waarde van die meetwaarde.
Deze uitleg laat het volgende zien:
Verkenningsopties:
Volgende stappen voor analyse:
| In dit voorbeeld wordt het percentage nullwaarden in de doelmeetwaarde weergegeven als een blauwe cirkel. |
Aantal records
Dit type uitleg beschrijft wanneer het aantal onderliggende records gecorreleerd is aan de som. Uit de analyse bleek dat er een verband bestaat tussen het aantal records dat in een markering wordt geaggregeerd en de werkelijke waarde van de markering.
Hoewel dit voor de hand liggend lijkt, kunt u met dit type uitleg onderzoeken of de waarde van de markering wordt beïnvloed door de omvang van de waarden in de records of simpelweg door het aantal records in de geanalyseerde markering.
Deze uitleg laat het volgende zien:
Verkenningsopties:
Volgende stappen voor analyse:
| In dit voorbeeld wordt het aantal records voor Reisafstand weergegeven voor elke waarde van Maand van rit. Dit is een dimensie in de oorspronkelijke visualisatie. Augustus heeft de hoogste totale waarde voor reisafstand. U kunt onderzoeken of augustus de hoogste waarde voor reisafstand heeft, omdat er in augustus meer ritten plaatsvonden of omdat sommige ritten langer waren. |
Gemiddelde waarde van de markering
Dit type uitleg beschrijft wanneer het gemiddelde van een meetwaarde gecorreleerd is aan de som. Vergelijk of de gemiddelde waarde laag of hoog is en of het aantal records laag of hoog is.
Deze uitleg laat het volgende zien:
Verkenningsopties:
Volgende stappen voor analyse:
| In dit voorbeeld is de gemiddelde reisafstand in augustus niet significant hoger of lager dan in de meeste maanden. Dit suggereert dat de reisafstand in augustus groter is omdat er in die maand meer ritten waren en niet omdat mensen langere ritten maakten. |
Bijdragende enkele waarde
Gebruik deze uitleg om inzicht te krijgen in de samenstelling van de recordwaarden waaruit de geanalyseerde markering bestaat.
Dit type uitleg identificeert wanneer één waarde in een niet-gevisualiseerde dimensie kan bijdragen aan de geaggregeerde waarde van de geanalyseerde markering. Een niet-gevisualiseerde dimensie is een dimensie die voorkomt in de databron, maar momenteel niet wordt gebruikt in de weergave.
Deze uitleg geeft het aan wanneer alle onderliggende records van een dimensie dezelfde waarde hebben of wanneer een dimensiewaarde opvalt omdat veel of weinig records dezelfde enkele waarde hebben voor de geanalyseerde markering.
Opmerking: zie Termen en concepten in uitleg(Link wordt in een nieuw venster geopend) voor definities van veelgebruikte termen in een uitleg.
Deze uitleg laat het volgende zien:
Verkenningsopties:
Volgende stappen voor analyse:
| In dit voorbeeld heeft de statistische analyse aangetoond dat veel ritten afkomstig zijn uit de stationsbuurt van Back Bay. Houd er rekening mee dat Stationsbuurt een niet-gevisualiseerde dimensie is die verband houdt met de reisafstand in de onderliggende data voor de bronvisualisatie. |
Meest bijdragende
Gebruik deze uitleg om te zien welke waarden het grootste deel van de geanalyseerde markering vormen.
Bij een COUNT-aggregatie worden de dimensiewaarden met de meeste records weergegeven door de meest bijdragende. Voor SUM toont deze uitleg dimensiewaarden met de grootste gedeeltelijke som.
Bijdragende dimensies
Gebruik deze uitleg om inzicht te krijgen in de samenstelling van de recordwaarden waaruit de geanalyseerde markering bestaat.
Dit type uitleg geeft aan wanneer de distributie van een niet-gevisualiseerde dimensie kan bijdragen aan de geaggregeerde waarde van de geanalyseerde markering. Dit type uitleg wordt gebruikt voor sommen, aantallen en gemiddelden van doelmeetwaarden. Een niet-gevisualiseerde dimensie is een dimensie die voorkomt in de databron, maar momenteel niet wordt gebruikt in de weergave.
Opmerking: zie Termen en concepten in uitleg(Link wordt in een nieuw venster geopend) voor definities van veelgebruikte termen in een uitleg.
Deze uitleg laat het volgende zien:
Verkenningsopties:
Volgende stappen voor analyse:
| In dit voorbeeld heeft de statistische analyse aangetoond dat er meer ritten werden gemaakt vanaf South Station en MIT en dat er minder ritten werden gemaakt vanaf Charles Circle en Kendall, vergeleken met de ritten die in het algemeen voor markeringen werden gemaakt. Houd er rekening mee dat Stationsnaam een niet-gevisualiseerde dimensie is die verband houdt met de reisafstand in de onderliggende data voor de bronvisualisatie. |
Bijdragende meetwaarden
Dit type uitleg geeft aan wanneer het gemiddelde van een niet-gevisualiseerde meetwaarde kan bijdragen aan de geaggregeerde waarde van de geanalyseerde markering. Een niet-gevisualiseerde meetwaarde is een meetwaarde die voorkomt in de databron, maar momenteel niet wordt gebruikt in de weergave.
Deze uitleg kan een lineair of kwadratisch verband tussen de niet-gevisualiseerde meetwaarde en de doelmeetwaarde onthullen.
Opmerking: zie Termen en concepten in uitleg(Link wordt in een nieuw venster geopend) voor definities van veelgebruikte termen in een uitleg.
Deze uitleg laat het volgende zien:
Verkenningsopties:
Volgende stappen voor analyse:
| In dit voorbeeld is een mogelijke reden waarom de reisafstand hoog is, dat de gemiddelde totale huurtijd ook hoog is. |
Andere zaken om te verkennen
In deze sectie worden mogelijke redenen beschreven waarom de geanalyseerde markering uniek of ongebruikelijk is. Deze uitleg:
- legt niet uit waarom deze markering een bepaalde waarde heeft;
- heeft op geen enkele manier betrekking op de waarde van de meetwaarden in de bronvisualisatie;
- houdt geen rekening met eventuele doelmeetwaarden.
Andere interessante dimensies
Gebruik deze uitleg om inzicht te krijgen in de samenstelling van de recordwaarden waaruit de geanalyseerde markering bestaat.
De distributie van een niet-gevisualiseerde dimensie in de geanalyseerde markering contrasteert op ongewone wijze met de distributie van waarden voor alle andere markeringen in de weergave. Een niet-gevisualiseerde dimensie is een dimensie die voorkomt in de databron, maar momenteel niet wordt gebruikt in de weergave.
Opmerking: zie Termen en concepten in uitleg(Link wordt in een nieuw venster geopend) voor definities van veelgebruikte termen in een uitleg.
Deze uitleg laat het volgende zien:
Verkenningsopties:
Volgende stappen voor analyse:
| In dit voorbeeld heeft een hoog percentage records betrekking op bewolkt weer. Omdat de data betrekking heeft op fietsverhuur in Boston en de geanalyseerde markering de reisafstand voor augustus is, kunnen we aannemen dat het weer doorgaans warm en vochtig is. Op bewolkte dagen huurden mensen misschien vaker een fiets om de hitte te vermijden. Het is ook mogelijk dat er in augustus meer bewolkte dagen waren. |