Voorbeeld – De levensverwachting van vrouwen verkennen met functies voor prognosemodellering

In dit voorbeeld wordt de opgeslagen databron Voorbeeld Wereldwijde indicatoren gebruikt die in Tableau opgenomen. We gebruiken de functies voor prognosemodellering MODEL_QUANTILE en MODEL_PERCENTILE om de relaties tussen gezondheidszorgkosten per hoofd van de bevolking, de levensverwachting van vrouwen en het geboortecijfer te onderzoeken.

Laten we beginnen met een visualisatie die de gezondheidszorgkosten van elk land vergelijkt met de levensverwachting van vrouwen. Als u de stappen wilt volgen en toegang wilt krijgen tot de vooraf gebouwde weergaven en dashboards, of de oplossing wilt bekijken, downloadt u de volgende werkmap van Tableau Public: Prognosemodellering van de levensverwachting van vrouwen (in het Engels).

Spreidingsdiagram met levensverwachting van vrouwen

MODEL_PERCENTILE gebruiken

Eerst evalueren we de levensverwachting en de gezondheidszorgkosten voor alle zichtbare markeringen. Hiermee kan Tableau een model bouwen op basis van deze markeringen en het percentiel voor elk cijfer binnen het model retourneren.

Stap 1: de voorspellingsberekening maken

Hebt u ook Tableau Server of Tableau Cloud en wilt u uw werk online doen in plaats van in Tableau Desktop? Publiceer dan de werkmap naar uw Tableau-server, klik op Werkmappen, selecteer de werkmap en kies vervolgens onder Acties Werkmap bewerken.

Zodra u de werkmap opent, ziet u dat deze uit verschillende bladen bestaat. U gebruikt deze velden om uw weergaven op te bouwen.

  1. Klik in de werkmap voor beginners op het blad Percentiel-startpakket.

  2. Open bovenaan het menu Analyse en selecteer vervolgens Berekend veld maken.

  3. Doe het volgende in de berekeningseditor:

    • Geef de berekening een naam: Percentielverwachting versus uitgaven

    • Opmerking: Als u de werkmap voor beginners gebruikt, ziet u verschillende namen voor de berekeningen die in dit voorbeeld worden gebruikt. Dit is zodat u de velden een naam kunt geven zoals hier beschreven, zonder dat er duplicaten ontstaan. Uw oplossing heeft misschien verschillende namen, maar de visualisaties moeten er hetzelfde uitzien.
    • Voer de volgende formule in:

      MODEL_PERCENTILE(AVG([Life Expectancy Female]), LOG(MEDIAN([Health Exp/Capita])))

    • Bij deze berekening wordt de gemiddelde levensverwachting als doelexpressie gebruikt en de mediane zorguitgaven als predictor. In dit geval hebben we een logaritmische transformatie gebruikt op de as van de uitgaven voor gezondheidszorg en voor de predictor.

      Opmerking: Omdat deze dataset zeer grote waarden bevat, hebben we onze data getransformeerd met behulp van een logaritmische schaal (in het Engels), wat handig is bij het analyseren van data met enkele waarden die veel hoger zijn dan de rest. Hierdoor kunt u gemakkelijker trends en relaties in uw dataset identificeren.
  4. Klik op OK.

    De voorspellingsberekening wordt nu toegevoegd als een berekend veld in het deelvenster Data.

Stap 2: de voorspellingsberekening toevoegen aan de weergave

In de visualisatie hierboven ziet u de gezondheidszorgkosten van elk land afgezet tegen de levensverwachting van vrouwen, gefilterd op 2012.

Laten we nu de berekening MODEL_PERCENTILE aan de weergave toevoegen en kijken welke inzichten we kunnen verkrijgen.

  1. Sleep Percentielverwachting versus uitgaven naar Kleur op de kaart Markeringen.

  2. Klik op de vervolgkeuzepijl op het veld en selecteer Berekenen met > Land/regio.

  3. Klik op Kleur op de kaart Markeringen en klik vervolgens op Kleuren bewerken.

    • Selecteer onder Palet Oranje-blauw uiteenlopend.

    • Selecteer het selectievakje Kleurgradatie,

    • Selecteer het selectievakje Omgekeerd.

  4. Klik op OK.

  5. Grafiek die de levensverwachting van vrouwen ten opzichte van de uitgaven weergeeft

    U ziet de distributie van landen waar de gezondheidsverwachting zowel hoger als lager is dan verwacht, gebaseerd op het uitgavenniveau. Over het algemeen geven de donkerrode markeringen aan dat de levensverwachting hoog is in verhouding tot de uitgaven aan gezondheidszorg, donkerblauw betekent dat de levensverwachting laag is in verhouding tot de uitgaven aan gezondheidszorg en grijs betekent dat de levensverwachting dicht bij de verwachtingen van het model ligt, op basis van het niveau van de uitgaven aan gezondheidszorg.

Stap 3: groepeer de resultaten op kleur

We maken de voorspellingsberekening in een nieuwe berekening om de resultaten te groeperen en de analyse te vereenvoudigen. We maken groepen zodat cijfers boven het 90e percentiel en onder het 10e percentiel bij elkaar worden gegroepeerd, cijfers in het 80e-90e percentielbereik en het 10e-20e percentielbereik bij elkaar worden gegroepeerd, enz. We zullen ook markeringen met een null-waarde highlighten en deze later behandelen met behulp van de andere functie voor prognosemodellering MODEL_QUANTILE.

  1. Doe het volgende in de berekeningseditor:

    • Geef de berekening een naam: Percentiel per kleur.

    • Voer de volgende formule in:

      IF
      ISNULL([Percentile Expectancy vs Spending])
      THEN "Null"
      ELSEIF [Percentile Expectancy vs Spending] >=0.9 OR
      [Percentile Expectancy vs Spending] <=0.1
      THEN "<10th & >90th percentile"
      ELSEIF [Percentile Expectancy vs Spending] >=0.8 OR
      [Percentile Expectancy vs Spending] <=0.2
      THEN "<20th & >80th percentile"
      ELSEIF [Percentile Expectancy vs Spending] >=0.7 OR
      [Percentile Expectancy vs Spending] <=0.3
      THEN "<30th & >70th percentile"
      ELSEIF [Percentile Expectancy vs Spending] >=0.6 OR
      [Percentile Expectancy vs Spending] <=0.4
      THEN "<40th & >60th percentile"
      ELSE "50th percentile +-10"
      END

  2. Voeg de nieuwe berekening toe aan Kleur op de kaart Markeringen.

  3. Klik op de vervolgkeuzepijl op het veld en selecteer Berekenen met > Land/regio.

  4. Klik op Kleur op de kaart Markeringen en klik vervolgens op Kleuren bewerken.

    • Pas de kleuren aan om de trend beter te zien. Laten we in dit geval het kleurenpalet Verkeerslicht en grijs voor null-waarden gebruiken.

  5. Klik op OK.

    Grafiek met resultaten gegroepeerd op kleur

    Als u naar de oranje markering in de hoek kijkt, ziet u dat de VS $ 8.895 per vrouw uitgeeft voor een levensverwachting van 81 jaar. Als u langs de x-as naar links beweegt, ziet u dat andere landen minder uitgeven en dezelfde levensverwachting hebben.

    Het model evalueert de sterkte van de relatie op elk punt. De VS bevindt zich hierin dicht bij de bovenkant van het verwachte bereik van het model.

Stap 4: vergelijk levensverwachting met geboortecijfer

We gaan nu kijken naar een visualisatie die de levensverwachting van vrouwen vergelijkt met het geboortecijfer. Er is een negatieve correlatie tussen geboortecijfers en de levensverwachting van vrouwen. Dit betekent echter niet dat hogere geboortecijfers leiden tot een lagere levensverwachting van vrouwen. Waarschijnlijk zijn er nog andere factoren die van invloed zijn op zowel de geboortecijfers als de levensverwachting van vrouwen, maar die zijn niet zichtbaar in deze dataweergave. Laten we het model toevoegen en kijken waar het model verwacht dat de levensverwachting van vrouwen op basis van de kosten voor de gezondheidszorg hoger of lager zal zijn.

Levensverwachting vergeleken met geboortecijfer

  1. Op het blad Geboortecijfer voegt u de voorspellingsberekening Percentiel per kleur aan Kleur op de kaart Markeringen toe om deze in beeld te brengen.

  2. Klik op de vervolgkeuzepijl op het veld en selecteer Berekenen met > Land/regio.

  3. Klik op Kleur op de kaart Markeringen en klik op Kleuren bewerken. Bewerk de kleuren zoals eerder, gebruik het palet Verkeerslicht en grijs voor null-waarden.

  4. Klik op OK.

    Grafiek ingezoomd op resultaten van Albanië en Armenië

    Tegenwoordig zijn de data veel meer verspreid. De rode band in de hoek rechtsonder geeft aan waar de levensverwachting het laagst en het geboortecijfer het hoogst is, en de gezondheidszorgkosten in verhouding tot de levensverwachting laag zijn. Als u de twee rode markeringen in het kwadrant linksboven bekijkt, die betrekking hebben op Albanië en Armenië, ziet u dat beide landen een hoge levensverwachting voor vrouwen, lagere geboortecijfers en lage gezondheidszorgkosten hebben.

    Zoals u kunt zien, konden we met MODEL_PERCENTILE vaststellen dat deze twee landen uitschieters zijn. Hoewel ze beide relatief lage gezondheidszorgkosten hebben, hebben ze in de context van het geboortecijfer nog steeds een relatief hoge levensverwachting.

    Knopinfo die laat zien dat Albanië een hoge levensverwachting heeft, zelfs met lage gezondheidszorgkosten

  5. Laten we nu eens kijken hoe u de andere functie voor prognosemodellering, MODEL_QUANTILE, kunt gebruiken om uw analyse voort te zetten.

MODEL_QUANTILE gebruiken

MODEL_QUANTILE wordt gebruikt om numerieke voorspellingen te genereren op basis van een doelpercentiel, doelexpressie en predictors. Het is het omgekeerde van MODEL_PERCENTILE.

Bedenk dat onze resultaten meerdere null-waarden bevatten, wat betekent dat sommige landen geen data over de uitgaven voor gezondheidszorg hebben. We gebruiken MODEL_QUANTILE om deze ontbrekende waarden te schatten.

Stap 1: voorspellingsberekeningen maken

We hebben de volgende berekening gebruikt:

MODEL_PERCENTILE(AVG([Life Expectancy Female]), LOG(MEDIAN([Health Exp/Capita])))

Ten eerste willen we deze functie omkeren om een voorspelling te krijgen van de gezondheidszorgkosten op basis van de levensverwachting van vrouwen.

  1. Klik in de werkmap voor beginners op het blad Kwantiel-startpakket.

  2. Open bovenaan het menu Analyse en selecteer vervolgens Berekend veld maken.

  3. Doe het volgende in de berekeningseditor:

    • Geef de berekening een naam: Kwantiel van levensverwachting versus uitgaven
    • Voer de volgende formule in:

      POWER(10, MODEL_QUANTILE(0.5, LOG(MEDIAN([Health Exp/Capita])), AVG([Life Expectancy Female])))

      We splitsen deze berekening op om het wat makkelijker te maken:

      • We beginnen met MODEL_QUANTILE, waarbij het eerste argument 0,5 is, waarmee wordt aangegeven welk percentiel moet worden voorspeld.
      • De doelexpressie is de mediane zorguitgaven per hoofd van de bevolking.
      • De predictor is de gemiddelde levensverwachting van vrouwen.
      • Bovendien hebben we de functie in een POWER-functie verpakt om de logaritmisch getransformeerde doelexpressie naar dollars te converteren.
  4. Klik op OK.

    De voorspellingsberekening wordt nu toegevoegd als een berekend veld in het deelvenster Data.

Stap 2: de voorspellingsberekening toevoegen aan de weergave

  1. Sleep het Kwantiel van levensverwachting versus uitgaven naar Knopinfo op de kaart Markeringen.

  2. Klik op de vervolgkeuzepijl op het veld en selecteer Berekenen met > Land/regio.

  3. Klik op Knopinfo op de kaart Markering en voeg een rij toe voor de MODEL_QUANTILE-voorspelling:

    • Geef de rij met knopinfo een naam: Voorspelde uitgaven aan gezondheidszorg op basis van de levensverwachting van vrouwen:

    • Klik op Invoegen en selecteer de berekening om ervoor te zorgen dat de knopinfo dynamisch de unieke voorspelling van de markering weergeeft terwijl u met de visualisatie werkt.

  4. Klik op OK.

    Knopinfo voor Indonesië

  5. Op dit moment heeft onze MODEL_QUANTILE-berekening slechts één predictor: de levensverwachting van vrouwen. Als u van links naar rechts beweegt en naar de knopinfo kijkt voor markeringen met dezelfde levensverwachting, ziet u dat elke markering dezelfde voorspelde gezondheidszorgkosten heeft. De voorspelde gezondheidszorgkosten voor Indonesië op basis van de levensverwachting bedragen $ 336, maar dat geldt ook voor Fiji, Egypte en andere landen met dezelfde levensverwachting voor vrouwen.

    Dit komt doordat het model voor elke markering dezelfde geschatte uitgaven geeft. Omdat we slechts één predictor gebruiken (de levensverwachting van vrouwen), geeft het model dezelfde resultaten voor alle markeringen waarbij de predictor dezelfde waarde heeft. U kunt meer nuance in het model aanbrengen door predictors toe te voegen.

Stap 3: voeg een voorspelling toe met een tweede predictor

Terwijl u uw voorspellingen doet, moet u bedenken welke velden goede predictors zijn voor uw doelwaarden en deze meenemen in uw berekeningen. U kunt hierbij een onbeperkt aantal dimensies en meetwaarden combineren. We kunnen bijvoorbeeld het BBP, de bevolking en andere velden als predictors toevoegen om onze voorspellingen te verbeteren. Laten we in dit geval Regio toevoegen.

  1. Doe het volgende in de berekeningseditor:

    • Geef de berekening een naam: Kwantiel uitgaven versus verwachting en regio

    • Voer de volgende formule in, die hetzelfde is als de vorige berekening, maar Regio als predictor toevoegt:

      POWER(10, MODEL_QUANTILE(0.5, LOG(MEDIAN([Health Exp/Capita])), AVG([Life Expectancy Female]), ATTR([Region])))

  2. Klik op OK.

  3. Voeg vervolgens de nieuwe berekening toe aan de knopinfo op de kaart Markeringen.

  4. Klik op Knopinfo en voeg een andere regel toe om de nieuwe voorspelling te beschrijven, zoals Voorspelde gezondheidszorgkosten op basis van de levensverwachting van vrouwen en hun regio:.

    Knopinfo voor Indonesië

    De knopinfo toont nu beide voorspellingen.

Stap 4: vergelijk werkelijke waarden met voorspelde waarden

Als laatste stap in uw analyse kunt u ook voorspellingsberekeningen maken die werkelijke en voorspelde waarden combineren. In ons voorbeeld laten we de werkelijke uitgaven voor gezondheidszorg zien waar deze beschikbaar zijn en de geschatte uitgaven waar deze niet beschikbaar zijn.

  1. Doe het volgende in de berekeningseditor:

    • Geef de berekening een naam: Werkelijke gezondheidsuitgaven vs. voorspelde waarde

    • Voer de volgende formule in, die de numerieke waarde van de voorspelling retourneert:

      ROUND(IFNULL(AVG([Health Exp/Capita]),[Quantile_HE/Cap_LEF,Region]),0)

  2. Klik op OK.

  3. Maak als volgt nog een berekening:

    • Geef de berekening een naam: Werkelijke gezondheidszorguitgaven versus voorspellingstag

    • Voer de volgende formule in, die als label voor de bovenstaande berekening zal dienen:

      STR(IF ISNULL(AVG([Health Exp/Capita])) THEN "(Estimate)" ELSE "(Actual)" END)

  4. Klik op OK.

  5. Voeg vervolgens beide berekeningen toe aan knopinfo op de kaart Markeringen.

  6. Klik op Knopinfo en voeg een andere regel toe om de nieuwe berekeningen te beschrijven:

    • Gezondheidszorgkosten per hoofd van de bevolking (werkelijk of geschat):

    • Voeg de nieuwe berekeningen een voor een in.

  7. Klik op OK.

    Knopinfo voor Bermuda

    Terwijl u met de visualisatie werkt, kunt u de gezondheidszorgkosten per hoofd van de bevolking van elk land zien, of een schatting bekijken als de werkelijke waarde (null-waarde) in de data ontbreekt.

    Op dezelfde manier kunt u met behulp van functies voor prognosemodellering in Tableau inzicht krijgen in uw data.

Bedankt voor uw feedback.De feedback is verzonden. Dank u wel.