Prognosemodellering met gegenereerde markeringen
Als u Tableau al een tijdje gebruikt, hebt u de term dataverdichting mogelijk al eens voorbij zien komen. Dit verwijst naar een proces waarbij markeringen door Tableau worden gegenereerd en aan de weergave worden toegevoegd, ook al worden deze markeringen niet door records in de onderliggende databron ondersteund. Dit kan worden gedaan om een datum-as uit te breiden, of als u functies van prognosemodellering gebruikt om voorspellingen te doen.
Meer informatie: lees dit blogbericht over dataverdichting (in het Engels) van Data Plus Science.
Voorspellingen voor ontbrekende waarden berekenen
U kunt bijvoorbeeld voorspellingen voor toekomstige datums toevoegen. Standaard worden ontbrekende waarden niet weergegeven in Tableau. U kunt deze markeringen als volgt genereren:
Klik met de rechtermuisknop (Control+Klik op Mac) op de koptekst van datum of bin.
Selecteer Ontbrekende waarden tonen.
Dit is echter niet voldoende om voorspellingen te kunnen doen op basis van de gegenereerde markeringen. Als u hiermee een berekening probeert uit te voeren (ongeacht of dat een voorspellingsberekening is of niet), retourneert Tableau null-waarden. Dit is te verwachten, aangezien deze markeringen gebaseerd zijn op ontbrekende waarden die niet bestaan.
Om voorspellingen te doen over de ontbrekende waarden, opent u bovenaan het menu Analyse en selecteert u vervolgens Eigenschappen van ontbrekende waarden afleiden.
Voorbeeld van voorspellingen op gegenereerde markeringen
We gaan dit gedrag nu verder onder de loep nemen. Hierbij vergelijken we drie verschillende illustraties die laten zien hoe de instellingen Ontbrekende waarden tonen en Eigenschappen van ontbrekende waarden afleiden van invloed kunnen zijn op uw visualisatie, afhankelijk van of een of beide zijn in- of uitgeschakeld. Om mee te doen, downloadt u de volgende werkmap van Tableau Public: Voorspellingen over ontbrekende waarden (in het Engels).
We hebben voorspellingen opgenomen met ATTR(DAY([Order Date])) als predictor. Dit is niet de beste predictor voor de data (en kan ontoereikende voorspellingen opleveren), maar voor de doeleinden van dit artikel is het een goed voorbeeld van Eigenschappen van ontbrekende waarden afleiden.
Elke visualisatie bevat dezelfde vier metingen op de container Rijen, zoals hieronder weergegeven:
- Rij 1:
SUM([Profit])
- Rij 2:
RUNNING_SUM(SUM([Profit]))
- Rij 3:
ATTR(DAY([Order Date]))
- Rij 4:
MODEL_QUANTILE(0.5, SUM([Profit]),ATTR(DAY([Order Date])))
Illustratie 1
In de bovenstaande afbeelding zijn zowel Ontbrekende waarden tonen als Eigenschappen van ontbrekende waarden afleiden uitgeschakeld. Dit zijn de standaardinstellingen in Tableau.
U ziet dezelfde visualisatie als Eigenschappen van ontbrekende waarden afleiden zou zijn ingeschakeld en Ontbrekende waarden tonen zou zijn uitgeschakeld. Dit komt omdat Eigenschappen van ontbrekende waarden afleiden alleen kan worden geactiveerd als Ontbrekende waarden tonen is ingeschakeld.
Illustratie 2
In de bovenstaande afbeelding is Ontbrekende waarden tonen ingeschakeld en Eigenschappen van ontbrekende waarden afleiden uitgeschakeld. De standaardinstelling is dat Eigenschappen van ontbrekende waarden afleiden is uitgeschakeld, zelfs wanneer Toon ontbrekende waarden is ingeschakeld.
Houd er rekening mee dat we in deze situatie geen waarde voor ATTR on DAY([Order Date]) berekenen voor de ontbrekende waarden (rij 3). We genereren wel een voorspelling voor de verdichte datums, maar deze zijn identiek voor alle ontbrekende datums, omdat we de werkelijke ATTR(DAY([Order Date])) niet kunnen afleiden zoals weergegeven in rij 3. In feite worden deze punten berekend alsof DAY([Order Date]) gelijk is aan nul.
Illustratie 3
Op deze afbeelding zijn zowel Ontbrekende waarden tonen en Eigenschappen van ontbrekende waarden ingeschakeld om te illustreren hoe de ingeschakelde instelling Eigenschappen van ontbrekende waarden afleidingen eruitziet.
Zoals u kunt zien, kunnen we de ATTR(DAY([Order Date])) (rij 3) afleiden en daardoor gebruiken in voorspellingen in rij 4, waardoor een vloeiende voorspellingscurve wordt geretourneerd.