Prognosemodellering met gegenereerde markeringen

Als u Tableau al een tijdje gebruikt, hebt u de term dataverdichting mogelijk al eens voorbij zien komen. Dit verwijst naar een proces waarbij markeringen door Tableau worden gegenereerd en aan de weergave worden toegevoegd, ook al worden deze markeringen niet door records in de onderliggende databron ondersteund. Dit kan worden gedaan om een datum-as uit te breiden, of als u functies van prognosemodellering gebruikt om voorspellingen te doen.

Een video bekijken: voor een grondige uiteenzetting over het verdichten van data, kunt u deze presentatie van TC19 bekijken: U hebt wat met uw data gedaan? Gedetailleerde informatie over toerekenen en verdichten van data (in het Engels).

Meer informatie: lees dit blogbericht over dataverdichting (in het Engels) van Data Plus Science.

Voorspellingen voor ontbrekende waarden berekenen

U kunt bijvoorbeeld voorspellingen voor toekomstige datums toevoegen. Standaard worden ontbrekende waarden niet weergegeven in Tableau. U kunt deze markeringen als volgt genereren:

  1. Klik met de rechtermuisknop (Control+Klik op Mac) op de koptekst van datum of bin.

  2. Selecteer Ontbrekende waarden tonen.

    contextmenu van veld met de optie Ontbrekende waarden tonen geselecteerd

  3. Dit is echter niet voldoende om voorspellingen te kunnen doen op basis van de gegenereerde markeringen. Als u hiermee een berekening probeert uit te voeren (ongeacht of dat een voorspellingsberekening is of niet), retourneert Tableau null-waarden. Dit is te verwachten, aangezien deze markeringen gebaseerd zijn op ontbrekende waarden die niet bestaan.

    Om voorspellingen te doen over de ontbrekende waarden, opent u bovenaan het menu Analyse en selecteert u vervolgens Eigenschappen van ontbrekende waarden afleiden.

    Analysemenu met Eigenschappen van ontbrekende waarden afleiden geselecteerd

    Opmerking: De standaardinstelling is dat Eigenschappen van ontbrekende waarden afleiden is uitgeschakeld, zelfs wanneer Ontbrekende waarden tonen is ingeschakeld. Op elk uitbreidbaar veld of elke as die met behulp van Ontbrekende waarden tonen kan worden uitgeklapt, kan deze instelling worden toegepast.

Voorbeeld van voorspellingen op gegenereerde markeringen

We gaan dit gedrag nu verder onder de loep nemen. Hierbij vergelijken we drie verschillende illustraties die laten zien hoe de instellingen Ontbrekende waarden tonen en Eigenschappen van ontbrekende waarden afleiden van invloed kunnen zijn op uw visualisatie, afhankelijk van of een of beide zijn in- of uitgeschakeld. Om mee te doen, downloadt u de volgende werkmap van Tableau Public: Voorspellingen over ontbrekende waarden (in het Engels).

We hebben voorspellingen opgenomen met ATTR(DAY([Order Date])) als predictor. Dit is niet de beste predictor voor de data (en kan ontoereikende voorspellingen opleveren), maar voor de doeleinden van dit artikel is het een goed voorbeeld van Eigenschappen van ontbrekende waarden afleiden.

Elke visualisatie bevat dezelfde vier metingen op de container Rijen, zoals hieronder weergegeven:

  • Rij 1: SUM([Profit])
  • Rij 2: RUNNING_SUM(SUM([Profit]))
  • Rij 3: ATTR(DAY([Order Date]))
  • Rij 4: MODEL_QUANTILE(0.5, SUM([Profit]),ATTR(DAY([Order Date])))

Illustratie 1

Illustratie 1

In de bovenstaande afbeelding zijn zowel Ontbrekende waarden tonen als Eigenschappen van ontbrekende waarden afleiden uitgeschakeld. Dit zijn de standaardinstellingen in Tableau.

U ziet dezelfde visualisatie als Eigenschappen van ontbrekende waarden afleiden zou zijn ingeschakeld en Ontbrekende waarden tonen zou zijn uitgeschakeld. Dit komt omdat Eigenschappen van ontbrekende waarden afleiden alleen kan worden geactiveerd als Ontbrekende waarden tonen is ingeschakeld.

Illustratie 2

Illustratie 2

In de bovenstaande afbeelding is Ontbrekende waarden tonen ingeschakeld en Eigenschappen van ontbrekende waarden afleiden uitgeschakeld. De standaardinstelling is dat Eigenschappen van ontbrekende waarden afleiden is uitgeschakeld, zelfs wanneer Toon ontbrekende waarden is ingeschakeld.

Houd er rekening mee dat we in deze situatie geen waarde voor ATTR on DAY([Order Date]) berekenen voor de ontbrekende waarden (rij 3). We genereren wel een voorspelling voor de verdichte datums, maar deze zijn identiek voor alle ontbrekende datums, omdat we de werkelijke ATTR(DAY([Order Date])) niet kunnen afleiden zoals weergegeven in rij 3. In feite worden deze punten berekend alsof DAY([Order Date]) gelijk is aan nul.

Illustratie 3

Illustratie 3

Op deze afbeelding zijn zowel Ontbrekende waarden tonen en Eigenschappen van ontbrekende waarden ingeschakeld om te illustreren hoe de ingeschakelde instelling Eigenschappen van ontbrekende waarden afleidingen eruitziet.

Zoals u kunt zien, kunnen we de ATTR(DAY([Order Date])) (rij 3) afleiden en daardoor gebruiken in voorspellingen in rij 4, waardoor een vloeiende voorspellingscurve wordt geretourneerd.

Bedankt voor uw feedback.De feedback is verzonden. Dank u wel.