Typen uitleg in Data uitleggen

Elke keer dat u een nieuwe markering selecteert in een visualisatie of dashboard en Data uitleggen uitvoert, voert Tableau een nieuwe statistische analyse uit op basis van die markering en de onderliggende data in de werkmap. Mogelijke verklaringen worden weergegeven in uitvouwbare secties voor het deelvenster Datagids. Zie Hoe Data uitleggen werkt voor informatie over hoe Data uitleggen uitleg analyseert en evalueert.

Onderliggende waarden verkennen

In deze sectie wordt uitleg gegeven voor elke maatregel die verklaard kan worden (aangeduid als doelmeetwaarden). Elke hier vermelde uitleg beschrijft een relatie met de waarden van de doelmeetwaarde die op de geanalyseerde markering worden getest. Gebruik uw praktische kennis van de data om te bepalen of de relaties die Data uitleggen heeft gevonden, zinvol zijn en de moeite waard zijn om te verkennen.

In dit voorbeeld is de Reisafstand de doelmeetwaarde

Onderliggende kenmerken

In de uitleg wordt beschreven hoe onderliggende records van de markeringen in de weergave kunnen bijdragen aan de geaggregeerde waarde van de meetwaarde die wordt toegelicht. Markeringskenmerken kunnen de extreme waarden, de nullwaarden, het aantal records of de gemiddelde waarde van de markering omvatten.

Opmerking: zie Termen en concepten in uitleg(Link wordt in een nieuw venster geopend) voor definities van veelgebruikte termen in een uitleg.

Extreme waarden

Dit type uitleg geeft aan of een of meerdere records waarden hebben die aanzienlijk hoger of lager zijn dan de meeste records. Als de verklaring door een model wordt ondersteund, geeft dit aan dat de extreme waarde de doelmeetwaarde van de geanalyseerde markering beïnvloedt.

Wanneer een markering extreme waarden heeft, betekent dit niet automatisch dat er ook uitschieters zijn of dat u die records uit de weergave moet weglaten. Die keuze is aan u en is afhankelijk van uw analyse. De uitleg geeft eenvoudigweg een extreme waarde aan in de markering. Het kan bijvoorbeeld voorkomen dat een foutief ingevoerde waarde in een record wordt aangetroffen, waarbij een banaan 10 euro kost in plaats van 10 cent. Of er kan staan dat een bepaalde verkoper een goed kwartaal heeft gehad.

Opmerking: deze uitleg moet door de auteur worden ingeschakeld om zichtbaar te zijn in de weergavemodus voor een gepubliceerde werkmap. Zie Toegang tot Data uitleggen beheren voor meer informatie.

Deze uitleg laat het volgende zien:

  • Het aantal onderliggende records in de geanalyseerde markering.
  • De extreme waarde of waarden die bijdragen aan de waarde van de doelmeetwaarde.
  • De verdeling van de waarden in de markering.
  • De recordgegevens die overeenkomen met elke distributiewaarde.

Verkenningsopties:

  • Wijs met de muis een cirkel aan in de grafiek om de bijbehorende waarde te bekijken.
  • Selecteer de pijl naar links of rechts onder de detaillijst om door de recorddetails te scrollen.
  • Selecteer indien beschikbaar Volledige data weergeven en selecteer vervolgens het tabblad Volledige data om alle records in een tabel te bekijken.
  • Selecteer het pictogram Openen  om een grotere versie van de visualisatie te zien.

Volgende stappen voor analyse:

  • Als het aantal records laag is, vergelijkt u deze waarden met de extreme waarde.
  • Als de extreme waarde aanzienlijk hoger of lager is dan de andere recordwaarden, sluit u deze uit en bekijkt u hoe deze de waarde van de geanalyseerde markering verandert.
  • Wanneer u de data met en zonder de extreme waarde bekijkt, kunt u deze gebruiken als een kans om uw praktische kennis over de data toe te passen.

 

In dit voorbeeld draagt een enkele extreme waarde van 463 huururen bij aan de hoger dan verwachte som van een totale huurtijd van 613 uur.

Een waarschijnlijke reden voor deze hoge waarde zou kunnen zijn dat iemand is vergeten de fiets in het dock te plaatsen toen deze werd teruggebracht. In dat geval kan het zijn dat de auteur deze waarde wil uitsluiten voor toekomstige analyses.

 

Het verschil visualiseren

In deze sectie ziet u het volgende:

  • Hoe de geanalyseerde markeringswaarde verandert wanneer de extreme waarde wordt uitgesloten.

 

 

 

 

 

 

 

Verkenningsopties:

  • Selecteer het pictogram Openen  om een grotere versie van de visualisatie te zien.
  • Ontdek het verschil met en zonder de extreme waarde (of waarden).
  • Auteurs kunnen de weergave openen als een nieuw blad en een filter toepassen om de extreme waarde uit te sluiten.

Volgende stappen voor analyse:

  • Als de extreme waarde aanzienlijk hoger of lager is dan de andere recordwaarden, sluit u deze uit en bekijkt u hoe deze de waarde van de geanalyseerde markering verandert.
  • Wanneer u de data met en zonder de extreme waarde bekijkt, kunt u deze gebruiken als een kans om uw praktische kennis over de data toe te passen.
 

In dit voorbeeld is de geanalyseerde markering niet meer zo hoog vergeleken met andere markeringen in de weergave wanneer de extreme waarde van 483 wordt uitgesloten. Andere kenmerken vallen nu op. De auteur zou de andere locaties eens nader kunnen bekijken om te achterhalen waarom deze locaties een hoger aantal uur hebben voor fietsverhuur.

Nullwaarden

Het type uitleg Nullwaarden geeft situaties aan waarin er een hogere hoeveelheid ontbrekende data in een markering is dan verwacht. Het geeft aan welk deel van de doelmeetwaarden null is en hoe de nullwaarden mogelijk bijdragen aan de geaggregeerde waarde van die meetwaarde.

Deze uitleg laat het volgende zien:

  • Het percentage waarden dat null is in de doelmeetwaarde voor de geanalyseerde markering (blauwe cirkel).

Verkenningsopties:

  • Wijs met de muis elke cirkel aan in het spreidingsdiagram om de details te bekijken.
  • Scrol naar beneden om meer van de grafiek te zien.
  • Selecteer het pictogram Openen  om een grotere versie van de visualisatie te zien.

Volgende stappen voor analyse:

  • U kunt eventueel nullwaarden uitsluiten in de markering voor verdere analyse.
 

In dit voorbeeld wordt het percentage nullwaarden in de doelmeetwaarde weergegeven als een blauwe cirkel.

Aantal records

Dit type uitleg beschrijft wanneer het aantal onderliggende records gecorreleerd is aan de som. Uit de analyse bleek dat er een verband bestaat tussen het aantal records dat in een markering wordt geaggregeerd en de werkelijke waarde van de markering.

Hoewel dit voor de hand liggend lijkt, kunt u met dit type uitleg onderzoeken of de waarde van de markering wordt beïnvloed door de omvang van de waarden in de records of simpelweg door het aantal records in de geanalyseerde markering.

Deze uitleg laat het volgende zien:

  • Het aantal records in de doelmeetwaarde voor de geanalyseerde markering (donkerblauwe balk).
  • Het aantal records in de doelmeetwaarde voor andere markeringen in de bronvisualisatie (lichtblauwe balk).

Verkenningsopties:

  • Wijs met de muis elke balk aan om de details te bekijken.
  • Scrol naar beneden om meer van de grafiek te zien.
  • Selecteer het pictogram Openen  om een grotere versie van de visualisatie te zien.

Volgende stappen voor analyse:

  • Vergelijk of de individuele waarden van records laag of hoog zijn, of dat het aantal records in de geanalyseerde markering laag of hoog is.
  • Auteurs, als u verrast bent door het grote aantal records, moet u de data mogelijk normaliseren.
 

In dit voorbeeld wordt het aantal records voor Reisafstand weergegeven voor elke waarde van Maand van rit. Dit is een dimensie in de oorspronkelijke visualisatie. Augustus heeft de hoogste totale waarde voor reisafstand.

U kunt onderzoeken of augustus de hoogste waarde voor reisafstand heeft, omdat er in augustus meer ritten plaatsvonden of omdat sommige ritten langer waren.

Gemiddelde waarde van de markering

Dit type uitleg beschrijft wanneer het gemiddelde van een meetwaarde gecorreleerd is aan de som. Vergelijk of de gemiddelde waarde laag of hoog is en of het aantal records laag of hoog is.

Deze uitleg laat het volgende zien:

  • Het gemiddelde van de doelmeetwaarde voor elke waarde van een dimensie die in de bronvisualisatie wordt gebruikt.

Verkenningsopties:

  • Wijs met de muis elke balk aan om de details te bekijken.
  • Scrol naar beneden om meer van de grafiek te zien.
  • Selecteer het pictogram Openen  om een grotere versie van de visualisatie te zien.

Volgende stappen voor analyse:

  • Vergelijk of de gemiddelde waarde laag of hoog is en of het aantal records laag of hoog is. Is de winst bijvoorbeeld hoog omdat u veel items hebt verkocht of omdat u dure items hebt verkocht?
  • Probeer erachter te komen waarom de geanalyseerde markering een significant hogere of lagere gemiddelde waarde heeft.

 

 

In dit voorbeeld is de gemiddelde reisafstand in augustus niet significant hoger of lager dan in de meeste maanden. Dit suggereert dat de reisafstand in augustus groter is omdat er in die maand meer ritten waren en niet omdat mensen langere ritten maakten.

 

Bijdragende enkele waarde

Gebruik deze uitleg om inzicht te krijgen in de samenstelling van de recordwaarden waaruit de geanalyseerde markering bestaat.

Dit type uitleg identificeert wanneer één waarde in een niet-gevisualiseerde dimensie kan bijdragen aan de geaggregeerde waarde van de geanalyseerde markering. Een niet-gevisualiseerde dimensie is een dimensie die voorkomt in de databron, maar momenteel niet wordt gebruikt in de weergave.

Deze uitleg geeft het aan wanneer alle onderliggende records van een dimensie dezelfde waarde hebben of wanneer een dimensiewaarde opvalt omdat veel of weinig records dezelfde enkele waarde hebben voor de geanalyseerde markering.

Opmerking: zie Termen en concepten in uitleg(Link wordt in een nieuw venster geopend) voor definities van veelgebruikte termen in een uitleg.

Deze uitleg laat het volgende zien:
  • Het percentage van het aantal records voor een enkele waarde van een dimensie voor de geanalyseerde markering (blauwe balk) ten opzichte van alle markeringen (grijze balk) in de bronvisualisatie.
  • Het percentage van het aantal records voor alle andere waarden van een dimensie voor de geanalyseerde markering (blauwe balk) ten opzichte van alle markeringen (grijze balk) in de bronvisualisatie.
  • Het gemiddelde van de doelmeetwaarde voor de enkele waarde van een dimensie in de geanalyseerde markering (blauwe balk) ten opzichte van alle markeringen (grijze balk).
  • Het gemiddelde van de doelmeetwaarde voor alle andere waarden van een dimensie voor de geanalyseerde markering (blauwe balk) ten opzichte van alle markeringen (grijze balk) in de bronvisualisatie.

Verkenningsopties:

  • Wijs met de muis elke balk aan om de details te bekijken.
  • Selecteer het pictogram Openen  om een grotere versie van de visualisatie te zien.

Volgende stappen voor analyse:

  • Gebruik deze uitleg om inzicht te krijgen in de samenstelling van de recordwaarden waaruit de geanalyseerde markering bestaat.
  • Auteurs kunnen een nieuwe visualisatie maken om een eventueel niet-gevisualiseerde dimensie die in deze uitleg naar voren komt te verkennen.
 

In dit voorbeeld heeft de statistische analyse aangetoond dat veel ritten afkomstig zijn uit de stationsbuurt van Back Bay. Houd er rekening mee dat Stationsbuurt een niet-gevisualiseerde dimensie is die verband houdt met de reisafstand in de onderliggende data voor de bronvisualisatie.

 

Meest bijdragende

Gebruik deze uitleg om te zien welke waarden het grootste deel van de geanalyseerde markering vormen.

Bij een COUNT-aggregatie worden de dimensiewaarden met de meeste records weergegeven door de meest bijdragende. Voor SUM toont deze uitleg dimensiewaarden met de grootste gedeeltelijke som.

 

Bijdragende dimensies

Gebruik deze uitleg om inzicht te krijgen in de samenstelling van de recordwaarden waaruit de geanalyseerde markering bestaat.

Dit type uitleg geeft aan wanneer de distributie van een niet-gevisualiseerde dimensie kan bijdragen aan de geaggregeerde waarde van de geanalyseerde markering. Dit type uitleg wordt gebruikt voor sommen, aantallen en gemiddelden van doelmeetwaarden. Een niet-gevisualiseerde dimensie is een dimensie die voorkomt in de databron, maar momenteel niet wordt gebruikt in de weergave.

Opmerking: zie Termen en concepten in uitleg(Link wordt in een nieuw venster geopend) voor definities van veelgebruikte termen in een uitleg.

Deze uitleg laat het volgende zien:
  • Het percentage van het aantal records voor alle waarden van een dimensie voor de geanalyseerde markering (blauwe balk) ten opzichte van alle waarden van een dimensie voor alle markeringen (grijze balk) in de bronvisualisatie.
  • Het gemiddelde van de doelmeetwaarde voor alle waarden van een dimensie voor de geanalyseerde markering (blauwe balk) ten opzichte van alle waarden van een dimensie voor alle markeringen (grijze balk).

Verkenningsopties:

  • Wijs met de muis elke balk aan om de details te bekijken.
  • Scrol naar beneden om meer van de grafiek te zien.
  • Selecteer het pictogram Openen  om een grotere versie van de visualisatie te zien.

Volgende stappen voor analyse:

  • Gebruik deze uitleg om inzicht te krijgen in de samenstelling van de recordwaarden waaruit de geanalyseerde markering bestaat.
  • Auteurs kunnen een nieuwe visualisatie maken om eventuele niet-gevisualiseerde dimensies die in deze uitleg naar voren komen te verkennen.
 

In dit voorbeeld heeft de statistische analyse aangetoond dat er meer ritten werden gemaakt vanaf South Station en MIT en dat er minder ritten werden gemaakt vanaf Charles Circle en Kendall, vergeleken met de ritten die in het algemeen voor markeringen werden gemaakt.

Houd er rekening mee dat Stationsnaam een niet-gevisualiseerde dimensie is die verband houdt met de reisafstand in de onderliggende data voor de bronvisualisatie.

 

Bijdragende meetwaarden

Dit type uitleg geeft aan wanneer het gemiddelde van een niet-gevisualiseerde meetwaarde kan bijdragen aan de geaggregeerde waarde van de geanalyseerde markering. Een niet-gevisualiseerde meetwaarde is een meetwaarde die voorkomt in de databron, maar momenteel niet wordt gebruikt in de weergave.

Deze uitleg kan een lineair of kwadratisch verband tussen de niet-gevisualiseerde meetwaarde en de doelmeetwaarde onthullen.

Opmerking: zie Termen en concepten in uitleg(Link wordt in een nieuw venster geopend) voor definities van veelgebruikte termen in een uitleg.

Deze uitleg laat het volgende zien:
  • Het verband tussen de som van de doelmeetwaarde en het gemiddelde van een niet-gevisualiseerde meetwaarde voor de geanalyseerde markering (blauwe cirkel) en alle markeringen (grijze cirkels) in de weergave.
  • Of de som van de doelmeetwaarde hoog of laag is omdat de gemiddelde waarde van de niet-gevisualiseerde meetwaarde hoog of laag is.

Verkenningsopties:

  • Wijs met de muis elke cirkel aan om de details te bekijken.
  • Selecteer het pictogram Openen  om een grotere versie van de visualisatie te zien.

Volgende stappen voor analyse:

  • Auteurs kunnen een nieuwe visualisatie maken om eventuele niet-gevisualiseerde meetwaarden die in deze uitleg naar voren komen te verkennen.
 

In dit voorbeeld is een mogelijke reden waarom de reisafstand hoog is, dat de gemiddelde totale huurtijd ook hoog is.

Andere zaken om te verkennen

In deze sectie worden mogelijke redenen beschreven waarom de geanalyseerde markering uniek of ongebruikelijk is. Deze uitleg:

  • legt niet uit waarom deze markering een bepaalde waarde heeft;
  • heeft op geen enkele manier betrekking op de waarde van de meetwaarden in de bronvisualisatie;
  • houdt geen rekening met eventuele doelmeetwaarden.

Andere interessante dimensies

Gebruik deze uitleg om inzicht te krijgen in de samenstelling van de recordwaarden waaruit de geanalyseerde markering bestaat.

De distributie van een niet-gevisualiseerde dimensie in de geanalyseerde markering contrasteert op ongewone wijze met de distributie van waarden voor alle andere markeringen in de weergave. Een niet-gevisualiseerde dimensie is een dimensie die voorkomt in de databron, maar momenteel niet wordt gebruikt in de weergave.

Opmerking: zie Termen en concepten in uitleg(Link wordt in een nieuw venster geopend) voor definities van veelgebruikte termen in een uitleg.

Deze uitleg laat het volgende zien:
  • Het percentage van het aantal records voor alle waarden van een dimensie voor de geanalyseerde markering (blauwe balk) ten opzichte van alle waarden van een dimensie voor alle markeringen (grijze balk) in de bronvisualisatie.

Verkenningsopties:

  • Wijs met de muis elke balk aan om de details te bekijken.
  • Scrol naar beneden om meer van de grafiek te zien.
  • Selecteer het pictogram Openen  om een grotere versie van de visualisatie te zien.

Volgende stappen voor analyse:

  • Gebruik deze uitleg om inzicht te krijgen in de samenstelling van de recordwaarden waaruit de geanalyseerde markering bestaat.
  • Auteurs kunnen een nieuwe visualisatie maken om eventuele niet-gevisualiseerde dimensies die in deze uitleg naar voren komen te verkennen.
 

In dit voorbeeld heeft een hoog percentage records betrekking op bewolkt weer. Omdat de data betrekking heeft op fietsverhuur in Boston en de geanalyseerde markering de reisafstand voor augustus is, kunnen we aannemen dat het weer doorgaans warm en vochtig is. Op bewolkte dagen huurden mensen misschien vaker een fiets om de hitte te vermijden. Het is ook mogelijk dat er in augustus meer bewolkte dagen waren.

 

Bedankt voor uw feedback.De feedback is verzonden. Dank u wel.