Prediktiv modellering med genererade markeringar
Om du har använt Tableau ett tag har du säkert hört frasen ”dataförtätning”. Detta syftar på en process där markeringar genereras av Tableau och läggs till i vyn, fastän dessa markeringar inte stöds av poster i den underliggande datakällan. Detta kan utföras för att förlänga datumaxeln eller, om du arbetar med funktioner för prediktiva modeller, för att visa prognoser.
Läs mer: Läs följande blogginlägg om dataförtätning från Data Plus Science.
Beräkna prognoser om saknade värden
Till exempel kanske du vill lägga till prognoser för framtida datum. Som standard visas inte saknade värden i Tableau, men du kan generera dessa markeringar genom följande steg:
Högerklicka (kontroll-klicka på Mac) på datumet eller klassrubriken.
Välj Visa saknade värden.
Men detta räcker inte för att du ska kunna göra prognoser för de markeringar som genererats. Om du har försökt att utföra en beräkning på dem (oavsett om det var en prognosberäkning eller inte) returnerade Tableau null-värden. Detta var väntat eftersom de markeringarna baseras på saknade värden som inte finns.
Du kan göra prognoser på dessa saknade värden genom att öppna menyn Analys längst upp och sedan välja Härled egenskaper från saknade värden.
Exempel på prognoser för genererade markeringar
Nu ska vi utforska beteendet vidare. Vi jämför tre olika illustrationer som visar hur inställningarna Visa saknade värden och Härled egenskaper från saknade värden kan påverka visualiseringen, beroende på om en eller båda är aktiverade eller inaktiverade. Följ med genom att ladda ner följande arbetsbok från Tableau Public (på engelska): Predictions on Missing Values.
Vi har inkluderar prognoser med ATTR(DAY([Orderdatum])) som prediktor. Det är inte den bästa prediktorn för dessa data (och ger otillräckliga prognoser), men för den här artikeln ger den en bra bild av Härled egenskaper från saknade värden.
Varje visualisering innehåller samma fyra mätvärden på hyllan Rader, enligt nedan:
- Rad 1:
SUM([Profit])
- Rad 2:
RUNNING_SUM(SUM([Profit]))
- Rad 3:
ATTR(DAY([Order Date]))
- Rad 4:
MODEL_QUANTILE(0.5, SUM([Profit]),ATTR(DAY([Order Date])))
Illustration 1
På bilden ovan är både Visa saknade värden och Härled egenskaper från saknade värden inaktiverade, vilket är standardinställningen i Tableau.
Du skulle se samma visualisering om Härled egenskaper från saknade värden var aktiverad och Visa saknade värden var inaktiverad. Det beror på att Härled egenskaper från saknade värden är beroende av att Visa saknade värden är aktiverad.
Illustration 2
På bilden ovan är Visa saknade värden aktiverad och Härled egenskaper från saknade värden inaktiverad. Som standard är Härled egenskaper från saknade värden inaktiverad, även när Visa saknade värden är aktiverad.
Observera att vi i den här situationen inte beräknar ett värde för ATTR på DAY([Orderdatum]) för de värden som saknas (rad 3). Vi genererar en prognos för förtätade datum, men de är identiska för alla datum som saknas eftersom vi inte kan härleda den faktiska ATTR(DAY([Orderdatum])) som visas på rad 3. Dessa markeringar beräknas därför som om DAY([Orderdatum]) är null.
Illustration 3
På den här bilden är både Visa saknade värden och Härled egenskaper från saknade värden aktiverade, vilket visar hur inställningen Härled egenskaper från saknade värden fungerar.
Som du ser kan vi, eftersom vi kan härleda ATTR(DAY([Orderdatum])) (rad 3), använda detta i prognoser i rad 4 och därmed få en jämn och fin prognoskurva.