Korrigera fel i prediktiva modelleringsfunktioner

När du använder prediktiva modelleringsfunktioner i Tableau kan du stöta på fel när du försöker lägga till beräkningarna till en visualisering. Detta beror ofta på kombinationen av prediktorer och visualiserade element, vilket i sig leder till en matematiskt ogiltig beräkning.

Det första du bör försöka dubbelkolla dimensionen Beräkna med. Kontrollera sedan att det inte finns en obalans mellan den LOD (detaljnivå) som anges i dina prediktorer och vyns LOD (detaljnivå). Verifiera även att dina prediktorer för vidare relevanta data till modellen, givet den aktuella visualiseringen.

I den här artikeln beskriver vi flera vanliga problem i mer detalj och hur du kan lösa dem.

Fel med prediktiva modelleringsfunktioner orsakas generellt sett av ett eller flera av följande problem. Detta beror på vilken modell som används.

Allmänna fel

Fel i gaussisk processregression

Dimensionen Beräkna med är ogiltig

När du visualiserar en prediktiv modelleringsfunktion måste dimensionen Beräkna med anges. Det rekommenderas att du väljer en specifik dimension (såsom Region eller Kategori) snarare än en riktad dimension (såsom Tabell över och sedan ner eller Ruta över).

Då du kan ha flera prediktiva modelleringsfunktioner inkluderade i en visualisering eller instrumentpanel hjälper det att välja en specifik uppdelningsdimension när du ska säkerställa att modeller skapas med samma underliggande datamängd för varje enskild funktion. Jämför med andra ord resultat från modeller med samma förutsättningar.

Se Omvandla värden med tabellberäkningar för mer information om adressering och uppdelning.

När du arbetar med prediktiva modelleringsfunktioner måste du se till att upprätthålla konsistens över de olika instanserna, både i olika iterationer av modellen (såsom när du väljer olika prediktorer) och i olika visualiseringar. Att använda riktningsberäkningen med dimensioner öppnar upp möjligheten att en trivial förändring i dina visualiserade data avsevärt påverkar de data som används för att bygga modellen, vilket i sin tur påverkar giltigheten och konsistens över olika visualiseringar.

Du kan se null-värden om ingen dimension med Beräkna med har angetts eller om en ogiltig dimension med Beräkna med, har valts.

Ogiltig dimension med Beräkna med inkluderar:

  • Cell: Den här dimensionen resulterar alltid i att en enda datapunkt används för att bygga en modell, och kommer inte att lyckas.
  • En kapslad dimension på högre nivå (om både Region och Län visualiseras på en axel där markeringar genereras för Län men grupperas per Region). Om Region väljs som uppdelningsdimension returnerar det null-värden då det inte finns några formaliserade markeringar för Region i den här vyn.

visualisering där dimensioner Beräkna med är Län och Kategori

I ovanstående visualisering är giltiga dimensioner Beräkna med, Län och Kategori. Att dela upp data per Län eller Kategori ger flera giltiga markeringar som kan användas för att skapa en modell.

Region listas som alternativet Beräkna med, med genererar inte några markeringar på den här vyns LOD (detaljnivå) och kan inte användas för att dela upp data.

Se Bearbeta med och Datapartitionering i prediktiv modellering för mer information.

Dimensionsprediktorer står i konflikt med den LOD (detaljnivå) som visualiseras

Dimensionsprediktorer måste vara på samma LOD (detaljnivå) som visualiseras eller högre. Detta innebär att om du visualiserar data per Län kan du använda Län, Region eller Land som prediktorer. Att använda Stad som prediktor orsakar dock ett fel. Då det finns flera städer inom ett län beräknas den här prediktorn till * för alla markeringar och returnerar inte någon meningsfull information. På grund av detta ignorerar Tableau funktionen.

Varje dimensionsprediktor måste vara innesluten i en ATTR-funktion, såsom:

MODEL_PERCENTILE(SUM([Sales]), ATTR([State]), ATTR([Category])

Flera prediktorer står i konflikt med varandra

Varje prediktor som används inom en given prediktiv modelleringsfunktion måste tillhandahålla oberoende information till beräkningen. Om två prediktorer väljs som är exakt ekvivalenta, skalade versioner eller inverser av varandra, returnerar den prediktiva modelleringsfunktionen ett fel när den visualiseras.

Som exempel kan en datauppsättning som spårar väderförhållanden över tid ha två fält: IsRain och IsClear. Dessa två fält är inverser av varandra. Det vill säga IsClear = True när IsRain = False och vice versa. Att inkludera både IsClear och IsRain som prediktorer på en enda prediktiv modelleringsfunktion returnerar ett fel.

Ovanstående gäller för både mätvärden och dimensioner när de används som prediktorer.

I båda fallen kan felet lösas genom att modifiera prediktorerna till att ta bort de korrelerade prediktorerna. Mer information finns i Att välja prediktorer.

Det finns inte tillräckligt med data för att bygga en modell

Det måste finnas minst tre markeringar inom en uppdelning för att prediktiva modelleringsfunktioner ska kunna skapa en modell och generera förutsägelser. Om det finns två eller färre markeringar i datauppsättningen, som definieras av data som visas och dimensionen Beräkna med, returnerar den prediktiva modelleringsfunktionen ett resultat med ett null-värde.

För att lösa det här problemet kan du revidera LOD (detaljnivå), datafiltreringsparametrar eller dimensionen Beräkna med så att varje uppdelning har mer än två markeringar.

En korrekt modell kunde inte konstrueras från de data som tillhandahålls

Det här felet visas om det finns en konflikt mellan de valda prediktorerna, den LOD (detaljnivå) som visualiseras och/eller den valda dimensionen Beräkna med. Detta kan innebära att det är omöjligt att använda prediktorerna för att skapa en rationell modell.

Låt oss till exempel titta på den här MODEL_QUANTILE-beräkningen:

MODEL_QUANTILE(0.5, MEDIAN([Profit]), ATTR(MONTH([Order Date])))

Att tillämpa den här beräkningen på en visualisering där varje markering representerar ett värde på Län returnerar följande fel:

felmeddelande

Orderdatum inte används för att visualisera eller segmentera data kan den prediktiva modelleringsfunktionen inte använda den indikerade prediktorn för att skapa en modell.

Så löser du detta:

  • Uppdatera visualiseringen till att inkludera prediktorn som en dimension.
  • Uppdatera funktionen till att ta bort den icke-viabla prediktorn.

Observera dock att det här felet återspeglar en dålig matchning mellan visualiseringen och tabellberäkningens specifika prediktorer. Samma beräkning skulle fungera utan problem om den tillämpades på en visualisering som inkluderade Orderdatum som en dimension.

Gaussisk processregression kräver exakt en ordnad dimensionsprediktor

För att använda Gaussisk processregression måste du inkludera exakt en ordnad dimension som prediktor. Du kan inkludera ytterligare oordnade dimensioner som prediktorer. Mätvärden kan inte användas som prediktorer med Gaussisk processregression.

Lägg till en ordnad dimensionsprediktor till din tabellberäkning om du stöter på det här felet. Ta sedan bort den överflödiga ordnade dimensionsprediktorn eller ange att en av de ordnade dimensionerna ska bearbetas som en oordnad dimension.

Så Gaussisk processregression bäst används på data i tidsserier har detta vanligtvis formen av en tidsbaserad prediktor såsom ATTR(DATETRUNC('month',[Order Date])). Valfri date_part kan användas i satsen DATETRUNC. date_part måste dock vara på samma eller högre LOD (detaljnivå) som visualiseringen. Det vill säga, om visualiseringen använder WEEK([Order Date]) som aggregeringsnivå, måste date_part vara 'week', 'month', 'quarter', osv. och kan inte vara 'dayofyear', 'day', 'weekday', 'hour', osv.

Observera att då ATTR(MONTH([Date])) returnerar strängvärden, fungerar den inte som en ordnad dimensionell prediktor om den inte specificeras manuellt. Detta görs genom att inkludera ”ordered” omedelbart före prediktorn, enligt nedan:

MODEL_PERCENTILE(
"model=gp",
SUM([Sales]),
"ordered",ATTR(MONTH([Order Date]))
)

För att inkludera flera tidsdimensioner i prediktorerna måste du ange vilka du vill använda som oordnade dimensioner. Du kan göra detta genom att inkludera ”unordered” direkt före dimensionen, enligt nedan:

MODEL_PERCENTILE(
"model=gp",
SUM([Sales]),
ATTR(DATETRUNC('month',[Order Date]))
"unordered",ATTR(DATETRUNC('year',[Order Date]))
)

Om du försöker använda ovanstående beräkning utan att ange ”unordered” framför ATTR(DATETRUNC('year',[Order Date]) returneras ett fel.

Dessutom måste adresseringsriktningen (eller ”Beräkna med”) för en Gaussisk processregression sättas till samma fält som den ordnade dimensionsprediktorn.

Endast en adresseringsriktning (eller ”Beräkna med”) kan väljas för alla modeller.

Gaussisk processregression har endast stöd för dimensioner som prediktorer

Du kan inte använda några mätvärden som prediktorer i Gaussiska processberäkningar. Ta bort mätvärden som prediktorer.

Den här begränsningen gäller endast för prediktiva modelleringsfunktioner som specificerar Gaussisk processregression. Linjär regression (eller OLS, standarden) och reglerade linjära regressionsfunktioner stödjer både mätvärden som prediktorer.

Det finns inga träningsdata för ett eller flera förutsägelsemål

Gaussisk processregression kräver att varje datauppdelning har minst n datapunkter för att bygga en prediktiv modell och returnera förutsägelser. Se över dina förutsägelser om du stöter på det här felet.

Det finns fler än 5000 markeringar

Gaussiska processregressioner stöds endast på visualiseringar med färre än 5000 markeringar. För att lösa det här problemet måste du uppdatera din LOD (detaljnivå) för att reducera antalet markeringar eller välja en annan statistisk modell.

Tack för din feedback!Din feedback har skickats in. Tack!