Voorbeeld – De levensverwachting van vrouwen verkennen met functies voor prognosemodellering
In dit voorbeeld wordt de opgeslagen databron Voorbeeld Wereldwijde indicatoren gebruikt die in Tableau opgenomen. We gebruiken de functies voor prognosemodellering MODEL_QUANTILE en MODEL_PERCENTILE om de relaties tussen gezondheidszorgkosten per hoofd van de bevolking, de levensverwachting van vrouwen en het geboortecijfer te onderzoeken.
Laten we beginnen met een visualisatie die de gezondheidszorgkosten van elk land vergelijkt met de levensverwachting van vrouwen. Als u de stappen wilt volgen en toegang wilt krijgen tot de vooraf gebouwde weergaven en dashboards, of de oplossing wilt bekijken, downloadt u de volgende werkmap van Tableau Public: Prognosemodellering van de levensverwachting van vrouwen (in het Engels).
MODEL_PERCENTILE gebruiken
Eerst evalueren we de levensverwachting en de gezondheidszorgkosten voor alle zichtbare markeringen. Hiermee kan Tableau een model bouwen op basis van deze markeringen en het percentiel voor elk cijfer binnen het model retourneren.
Stap 1: de voorspellingsberekening maken
Hebt u ook Tableau Server of Tableau Cloud en wilt u uw werk online doen in plaats van in Tableau Desktop? Publiceer dan de werkmap naar uw Tableau-server, klik op Werkmappen, selecteer de werkmap en kies vervolgens onder Acties Werkmap bewerken.
Zodra u de werkmap opent, ziet u dat deze uit verschillende bladen bestaat. U gebruikt deze velden om uw weergaven op te bouwen.
Klik in de werkmap voor beginners op het blad Percentiel-startpakket.
Open bovenaan het menu Analyse en selecteer vervolgens Berekend veld maken.
Doe het volgende in de berekeningseditor:
Geef de berekening een naam: Percentielverwachting versus uitgaven
Voer de volgende formule in:
MODEL_PERCENTILE(AVG([Life Expectancy Female]), LOG(MEDIAN([Health Exp/Capita])))
Klik op OK.
De voorspellingsberekening wordt nu toegevoegd als een berekend veld in het deelvenster Data.
Bij deze berekening wordt de gemiddelde levensverwachting als doelexpressie gebruikt en de mediane zorguitgaven als predictor. In dit geval hebben we een logaritmische transformatie gebruikt op de as van de uitgaven voor gezondheidszorg en voor de predictor.
Stap 2: de voorspellingsberekening toevoegen aan de weergave
In de visualisatie hierboven ziet u de gezondheidszorgkosten van elk land afgezet tegen de levensverwachting van vrouwen, gefilterd op 2012.
Laten we nu de berekening MODEL_PERCENTILE aan de weergave toevoegen en kijken welke inzichten we kunnen verkrijgen.
Sleep Percentielverwachting versus uitgaven naar Kleur op de kaart Markeringen.
Klik op de vervolgkeuzepijl op het veld en selecteer Berekenen met > Land/regio.
Klik op Kleur op de kaart Markeringen en klik vervolgens op Kleuren bewerken.
Selecteer onder Palet Oranje-blauw uiteenlopend.
Selecteer het selectievakje Kleurgradatie,
Selecteer het selectievakje Omgekeerd.
Klik op OK.
U ziet de distributie van landen waar de gezondheidsverwachting zowel hoger als lager is dan verwacht, gebaseerd op het uitgavenniveau. Over het algemeen geven de donkerrode markeringen aan dat de levensverwachting hoog is in verhouding tot de uitgaven aan gezondheidszorg, donkerblauw betekent dat de levensverwachting laag is in verhouding tot de uitgaven aan gezondheidszorg en grijs betekent dat de levensverwachting dicht bij de verwachtingen van het model ligt, op basis van het niveau van de uitgaven aan gezondheidszorg.
Stap 3: groepeer de resultaten op kleur
We maken de voorspellingsberekening in een nieuwe berekening om de resultaten te groeperen en de analyse te vereenvoudigen. We maken groepen zodat cijfers boven het 90e percentiel en onder het 10e percentiel bij elkaar worden gegroepeerd, cijfers in het 80e-90e percentielbereik en het 10e-20e percentielbereik bij elkaar worden gegroepeerd, enz. We zullen ook markeringen met een null-waarde highlighten en deze later behandelen met behulp van de andere functie voor prognosemodellering MODEL_QUANTILE.
Doe het volgende in de berekeningseditor:
Geef de berekening een naam: Percentiel per kleur.
Voer de volgende formule in:
IF
ISNULL([Percentile Expectancy vs Spending])
THEN "Null"
ELSEIF [Percentile Expectancy vs Spending] >=0.9 OR
[Percentile Expectancy vs Spending] <=0.1
THEN "<10th & >90th percentile"
ELSEIF [Percentile Expectancy vs Spending] >=0.8 OR
[Percentile Expectancy vs Spending] <=0.2
THEN "<20th & >80th percentile"
ELSEIF [Percentile Expectancy vs Spending] >=0.7 OR
[Percentile Expectancy vs Spending] <=0.3
THEN "<30th & >70th percentile"
ELSEIF [Percentile Expectancy vs Spending] >=0.6 OR
[Percentile Expectancy vs Spending] <=0.4
THEN "<40th & >60th percentile"
ELSE "50th percentile +-10"
ENDVoeg de nieuwe berekening toe aan Kleur op de kaart Markeringen.
Klik op de vervolgkeuzepijl op het veld en selecteer Berekenen met > Land/regio.
Klik op Kleur op de kaart Markeringen en klik vervolgens op Kleuren bewerken.
Pas de kleuren aan om de trend beter te zien. Laten we in dit geval het kleurenpalet Verkeerslicht en grijs voor null-waarden gebruiken.
Klik op OK.
Als u naar de oranje markering in de hoek kijkt, ziet u dat de VS $ 8.895 per vrouw uitgeeft voor een levensverwachting van 81 jaar. Als u langs de x-as naar links beweegt, ziet u dat andere landen minder uitgeven en dezelfde levensverwachting hebben.
Het model evalueert de sterkte van de relatie op elk punt. De VS bevindt zich hierin dicht bij de bovenkant van het verwachte bereik van het model.
Stap 4: vergelijk levensverwachting met geboortecijfer
We gaan nu kijken naar een visualisatie die de levensverwachting van vrouwen vergelijkt met het geboortecijfer. Er is een negatieve correlatie tussen geboortecijfers en de levensverwachting van vrouwen. Dit betekent echter niet dat hogere geboortecijfers leiden tot een lagere levensverwachting van vrouwen. Waarschijnlijk zijn er nog andere factoren die van invloed zijn op zowel de geboortecijfers als de levensverwachting van vrouwen, maar die zijn niet zichtbaar in deze dataweergave. Laten we het model toevoegen en kijken waar het model verwacht dat de levensverwachting van vrouwen op basis van de kosten voor de gezondheidszorg hoger of lager zal zijn.
Op het blad Geboortecijfer voegt u de voorspellingsberekening Percentiel per kleur aan Kleur op de kaart Markeringen toe om deze in beeld te brengen.
Klik op de vervolgkeuzepijl op het veld en selecteer Berekenen met > Land/regio.
Klik op Kleur op de kaart Markeringen en klik op Kleuren bewerken. Bewerk de kleuren zoals eerder, gebruik het palet Verkeerslicht en grijs voor null-waarden.
Klik op OK.
Tegenwoordig zijn de data veel meer verspreid. De rode band in de hoek rechtsonder geeft aan waar de levensverwachting het laagst en het geboortecijfer het hoogst is, en de gezondheidszorgkosten in verhouding tot de levensverwachting laag zijn. Als u de twee rode markeringen in het kwadrant linksboven bekijkt, die betrekking hebben op Albanië en Armenië, ziet u dat beide landen een hoge levensverwachting voor vrouwen, lagere geboortecijfers en lage gezondheidszorgkosten hebben.
Zoals u kunt zien, konden we met MODEL_PERCENTILE vaststellen dat deze twee landen uitschieters zijn. Hoewel ze beide relatief lage gezondheidszorgkosten hebben, hebben ze in de context van het geboortecijfer nog steeds een relatief hoge levensverwachting.
Laten we nu eens kijken hoe u de andere functie voor prognosemodellering, MODEL_QUANTILE, kunt gebruiken om uw analyse voort te zetten.
MODEL_QUANTILE gebruiken
MODEL_QUANTILE wordt gebruikt om numerieke voorspellingen te genereren op basis van een doelpercentiel, doelexpressie en predictors. Het is het omgekeerde van MODEL_PERCENTILE.
Bedenk dat onze resultaten meerdere null-waarden bevatten, wat betekent dat sommige landen geen data over de uitgaven voor gezondheidszorg hebben. We gebruiken MODEL_QUANTILE om deze ontbrekende waarden te schatten.
Stap 1: voorspellingsberekeningen maken
We hebben de volgende berekening gebruikt:
MODEL_PERCENTILE(AVG([Life Expectancy Female]), LOG(MEDIAN([Health Exp/Capita])))
Ten eerste willen we deze functie omkeren om een voorspelling te krijgen van de gezondheidszorgkosten op basis van de levensverwachting van vrouwen.
Klik in de werkmap voor beginners op het blad Kwantiel-startpakket.
Open bovenaan het menu Analyse en selecteer vervolgens Berekend veld maken.
Doe het volgende in de berekeningseditor:
- Geef de berekening een naam: Kwantiel van levensverwachting versus uitgaven
Voer de volgende formule in:
POWER(10, MODEL_QUANTILE(0.5, LOG(MEDIAN([Health Exp/Capita])), AVG([Life Expectancy Female])))
We splitsen deze berekening op om het wat makkelijker te maken:
- We beginnen met MODEL_QUANTILE, waarbij het eerste argument 0,5 is, waarmee wordt aangegeven welk percentiel moet worden voorspeld.
- De doelexpressie is de mediane zorguitgaven per hoofd van de bevolking.
- De predictor is de gemiddelde levensverwachting van vrouwen.
- Bovendien hebben we de functie in een POWER-functie verpakt om de logaritmisch getransformeerde doelexpressie naar dollars te converteren.
Klik op OK.
De voorspellingsberekening wordt nu toegevoegd als een berekend veld in het deelvenster Data.
Stap 2: de voorspellingsberekening toevoegen aan de weergave
Sleep het Kwantiel van levensverwachting versus uitgaven naar Knopinfo op de kaart Markeringen.
Klik op de vervolgkeuzepijl op het veld en selecteer Berekenen met > Land/regio.
Klik op Knopinfo op de kaart Markering en voeg een rij toe voor de MODEL_QUANTILE-voorspelling:
Geef de rij met knopinfo een naam: Voorspelde uitgaven aan gezondheidszorg op basis van de levensverwachting van vrouwen:
Klik op Invoegen en selecteer de berekening om ervoor te zorgen dat de knopinfo dynamisch de unieke voorspelling van de markering weergeeft terwijl u met de visualisatie werkt.
Klik op OK.
Op dit moment heeft onze MODEL_QUANTILE-berekening slechts één predictor: de levensverwachting van vrouwen. Als u van links naar rechts beweegt en naar de knopinfo kijkt voor markeringen met dezelfde levensverwachting, ziet u dat elke markering dezelfde voorspelde gezondheidszorgkosten heeft. De voorspelde gezondheidszorgkosten voor Indonesië op basis van de levensverwachting bedragen $ 336, maar dat geldt ook voor Fiji, Egypte en andere landen met dezelfde levensverwachting voor vrouwen.
Dit komt doordat het model voor elke markering dezelfde geschatte uitgaven geeft. Omdat we slechts één predictor gebruiken (de levensverwachting van vrouwen), geeft het model dezelfde resultaten voor alle markeringen waarbij de predictor dezelfde waarde heeft. U kunt meer nuance in het model aanbrengen door predictors toe te voegen.
Stap 3: voeg een voorspelling toe met een tweede predictor
Terwijl u uw voorspellingen doet, moet u bedenken welke velden goede predictors zijn voor uw doelwaarden en deze meenemen in uw berekeningen. U kunt hierbij een onbeperkt aantal dimensies en meetwaarden combineren. We kunnen bijvoorbeeld het BBP, de bevolking en andere velden als predictors toevoegen om onze voorspellingen te verbeteren. Laten we in dit geval Regio toevoegen.
Doe het volgende in de berekeningseditor:
Geef de berekening een naam: Kwantiel uitgaven versus verwachting en regio
Voer de volgende formule in, die hetzelfde is als de vorige berekening, maar Regio als predictor toevoegt:
POWER(10, MODEL_QUANTILE(0.5, LOG(MEDIAN([Health Exp/Capita])), AVG([Life Expectancy Female]), ATTR([Region])))
Klik op OK.
Voeg vervolgens de nieuwe berekening toe aan de knopinfo op de kaart Markeringen.
Klik op Knopinfo en voeg een andere regel toe om de nieuwe voorspelling te beschrijven, zoals Voorspelde gezondheidszorgkosten op basis van de levensverwachting van vrouwen en hun regio:.
De knopinfo toont nu beide voorspellingen.
Stap 4: vergelijk werkelijke waarden met voorspelde waarden
Als laatste stap in uw analyse kunt u ook voorspellingsberekeningen maken die werkelijke en voorspelde waarden combineren. In ons voorbeeld laten we de werkelijke uitgaven voor gezondheidszorg zien waar deze beschikbaar zijn en de geschatte uitgaven waar deze niet beschikbaar zijn.
Doe het volgende in de berekeningseditor:
Geef de berekening een naam: Werkelijke gezondheidsuitgaven vs. voorspelde waarde
Voer de volgende formule in, die de numerieke waarde van de voorspelling retourneert:
ROUND(IFNULL(AVG([Health Exp/Capita]),[Quantile_HE/Cap_LEF,Region]),0)
Klik op OK.
Maak als volgt nog een berekening:
Geef de berekening een naam: Werkelijke gezondheidszorguitgaven versus voorspellingstag
Voer de volgende formule in, die als label voor de bovenstaande berekening zal dienen:
STR(IF ISNULL(AVG([Health Exp/Capita])) THEN "(Estimate)" ELSE "(Actual)" END)
Klik op OK.
Voeg vervolgens beide berekeningen toe aan knopinfo op de kaart Markeringen.
Klik op Knopinfo en voeg een andere regel toe om de nieuwe berekeningen te beschrijven:
Gezondheidszorgkosten per hoofd van de bevolking (werkelijk of geschat):
Voeg de nieuwe berekeningen een voor een in.
Klik op OK.
Terwijl u met de visualisatie werkt, kunt u de gezondheidszorgkosten per hoofd van de bevolking van elk land zien, of een schatting bekijken als de werkelijke waarde (null-waarde) in de data ontbreekt.
Op dezelfde manier kunt u met behulp van functies voor prognosemodellering in Tableau inzicht krijgen in uw data.