Ejemplo: estudiar la esperanza de vida femenina con funciones de modelado predictivo
Este ejemplo usa la fuente de datos guardados de Indicadores Mundiales que se suministra con Tableau. Usaremos las funciones de modelado predictivo MODEL_QUANTILE y MODEL_PERCENTILE para explorar las relaciones entre el gasto en salud per cápita, la esperanza de vida femenina y la tasa de natalidad.
Comencemos con una visualización que compara el gasto en salud de cada país con su esperanza de vida femenina. Para seguir la historia y acceder a las vistas y paneles ya creados, o para ver los resultados, descargue el siguiente libro de trabajo de Tableau Public: Modelado predictivo de la esperanza de vida femenina.
Uso de MODEL_PERCENTILE
Primero evaluaremos la esperanza de vida y los gastos de salud para todas las marcas visibles. Esto permitirá a Tableau crear un modelo a partir de esas marcas y devolver el percentil de cada uno dentro del modelo.
Paso 1: crear el cálculo de predicción
Si también tiene Tableau Server o Tableau Cloud, y quiere realizar el trabajo de creación en la Web en lugar de hacerlo en Tableau Desktop, publique el libro de trabajo en su servidor de Tableau, haga clic en Libros de trabajo, seleccione el libro de trabajo y, en Acciones, haga clic en Editar libro de trabajo.
Una vez abierto el libro de trabajo, verá que tiene varias hojas. Usará estas hojas para crear sus vistas.
En el libro de trabajo de inicio, haga clic en la hoja Percentil de inicio.
Abra el menú Análisis en la parte superior y, a continuación, seleccione Crear campo calculado.
En el editor de cálculo, haga lo siguiente:
Nombre el cálculo: Porcentaje de expectativa vs gasto
Escriba la fórmula siguiente:
MODEL_PERCENTILE(AVG([Life Expectancy Female]), LOG(MEDIAN([Health Exp/Capita])))
Haga clic en Aceptar.
El cálculo de predicción ahora se agrega como un campo calculado en el panel Datos.
Este cálculo utiliza la esperanza de vida media como expresión de destino y la media de los gastos de salud como predictor. En este caso, usamos una transformación logarítmica en el eje de gasto de salud, igual que para el predictor.
Paso 2: agregar el cálculo de predicción a la vista
En la visualización anterior, se puede ver el gasto sanitario de cada país en comparación con su esperanza de vida femenina, filtrada a 2012.
Ahora, agreguemos el cálculo de MODEL_PERCENTILE a la vista y veamos qué información podemos obtener.
Arrastre Porcentaje de expectativa vs gasto a Color en la tarjeta Marcas.
Haga clic en la flecha desplegable en el óvalo y seleccione Calcular mediante > País/Región.
Haga clic en Color en la tarjeta Marcas y, después, en Editar colores.
En Paleta, seleccione Naranja-azul divergente.
Seleccione la casilla de verificación Color escalonado.
Seleccione la casilla de verificación Invertido.
Haga clic en Aceptar.
Puede ver la distribución de los países donde la expectativa de salud es más alta y menor de lo esperado en función del nivel de gasto. Tenga en cuenta que, en general, las marcas de color rojo oscuro indican que la esperanza de vida es alta en relación con el gasto sanitario, el azul oscuro significa que la esperanza de vida es baja en relación con el gasto sanitario, y el gris significa que la esperanza de vida está cerca de lo que el modelo espera, en función del nivel de gasto sanitario.
Paso 3: agrupar los resultados por color
Para simplificar el análisis, vamos a usar el cálculo de predicción dentro de un nuevo cálculo para agrupar los resultados. Construiremos grupos para que las marcas por encima del percentil 90 y por debajo del percentil 10 se agrupen, las marcas en el rango de percentiles 80-90 y el rango de percentiles 10-20 se agrupen, y así sucesivamente. También resaltaremos las marcas con un valor nulo y las abordaremos más adelante mediante la otra función de modelado predictivo, MODEL_QUANTILE.
En el editor de cálculo, haga lo siguiente:
Asigne un nombre al cálculo: Percentil por color.
Escriba la fórmula siguiente:
IF
ISNULL([Percentile Expectancy vs Spending])
THEN "Null"
ELSEIF [Percentile Expectancy vs Spending] >=0.9 OR
[Percentile Expectancy vs Spending] <=0.1
THEN "<10th & >90th percentile"
ELSEIF [Percentile Expectancy vs Spending] >=0.8 OR
[Percentile Expectancy vs Spending] <=0.2
THEN "<20th & >80th percentile"
ELSEIF [Percentile Expectancy vs Spending] >=0.7 OR
[Percentile Expectancy vs Spending] <=0.3
THEN "<30th & >70th percentile"
ELSEIF [Percentile Expectancy vs Spending] >=0.6 OR
[Percentile Expectancy vs Spending] <=0.4
THEN "<40th & >60th percentile"
ELSE "50th percentile +-10"
ENDAgregue el nuevo cálculo a Color de la tarjeta Marcas.
Haga clic en la flecha desplegable en el óvalo y seleccione Calcular mediante > País/Región.
Haga clic en Color en la tarjeta Marcas y, después, en Editar colores.
Ajuste los colores para ver mejor la tendencia. En este caso, vamos a usar la paleta de colores Semáforo y usemos gris para los valores nulos.
Haga clic en Aceptar.
Mirando la marca naranja en la esquina, observe que en los EE. UU., se gastan 8,895 $ por mujer para una esperanza de vida de 81 años. Desplazándonos a lo largo del eje X a la izquierda, se puede ver que otros países gastan menos y tienen la misma esperanza de vida.
El modelo evalúa la fuerza de la relación en cada punto, donde EE. UU. está cerca del extremo superior del rango esperado del modelo.
Paso 4: comparar la esperanza de vida con la tasa de natalidad
A continuación, echemos un vistazo a una visualización que compara la esperanza de vida femenina con la tasa de natalidad. Observe que hay una correlación negativa entre las tasas de natalidad y la esperanza de vida femenina; sin embargo, esto no significa que las tasas de natalidad más altas causen una menor esperanza de vida femenina. Es probable que haya factores adicionales que afectan tanto las tasas de natalidad como la esperanza de vida femenina que no son visibles en esta vista de los datos. Pero agreguemos el modelo y veamos dónde se espera que el modelo sea mayor o menor dados los gastos de salud.
En la hoja Tasa de natalidad, agregue el cálculo de predicción Percentil por color a Color en la tarjeta Marcas para incorporarlo a la vista.
Haga clic en la flecha desplegable en el óvalo y seleccione Calcular mediante > País/Región.
Haga clic en Color en la tarjeta Marcas y seleccione Editar colores. Edite los colores como antes, utilizando la paleta Semáforo y el gris para valores nulos.
Haga clic en Aceptar.
Ahora los datos están mucho mejor distribuidos. La banda roja en la esquina inferior derecha es donde la esperanza de vida es más baja, pero la tasa de natalidad es más alta, y el gasto en atención médica en relación con la esperanza de vida es bajo. Al señalar las dos marcas rojas en el cuadrante superior izquierdo, que pertenecen a Albania y Armenia, verá que ambos países tienen una alta esperanza de vida femenina, tasas de natalidad más bajas y bajos gastos sanitarios.
Como puede ver, pudimos utilizar MODEL_PERCENTILE para identificar que estos dos países son atípicos: a pesar de que ambos tenían un gasto sanitario relativamente bajo, tienen expectativas de vida relativamente altas, situadas en el contexto de la tasa de natalidad.
Ahora, veamos cómo puede usar la otra función de modelado predictivo, MODEL_QUANTILE, para continuar su análisis.
Uso de MODEL_QUANTILE
MODEL_QUANTILE se utiliza para generar predicciones numéricas, dado un percentil de destino, una expresión de destino y predictores. Esta función es la inversa de MODEL_PERCENTILE.
Recuerde que tenemos varios valores nulos en nuestros resultados, lo que significa que algunos países no tienen datos de gastos sanitarios. Usaremos MODEL_QUANTILE para estimar esos valores que faltan.
Paso 1: crear los cálculos de predicción
Hemos estado trabajando con este cálculo:
MODEL_PERCENTILE(AVG([Life Expectancy Female]), LOG(MEDIAN([Health Exp/Capita])))
En primer lugar, queremos invertir esta función con el fin de obtener una predicción para el gasto sanitario basada en la esperanza de vida femenina.
En el libro de trabajo de inicio, haga clic en la hoja Cuantil de inicio (Quantile Starter).
Abra el menú Análisis en la parte superior y, a continuación, seleccione Crear campo calculado.
En el editor de cálculo, haga lo siguiente:
- Nombre el cálculo: Cuantil de esperanza de vida vs gasto
Escriba la fórmula siguiente:
POWER(10, MODEL_QUANTILE(0.5, LOG(MEDIAN([Health Exp/Capita])), AVG([Life Expectancy Female])))
Vamos a desglosar este cálculo para entenderlo mejor:
- Comenzamos con MODEL_QUANTILE, donde el primer argumento es 0,5, especificando qué percentil predecir.
- La expresión objetivo es la mediana del gasto sanitario per cápita.
- El predictor es la esperanza de vida femenina promedio.
- Además, ajustamos la función dentro de una función POWER para convertir la expresión de destino transformada por registro en dólares.
Haga clic en Aceptar.
El cálculo de predicción ahora se agrega como un campo calculado en el panel Datos.
Paso 2: agregar el cálculo de predicción a la vista
Arrastre Cuantil de esperanza de vida vs gasto a Descripción en la tarjeta Marcas.
Haga clic en la flecha desplegable en el óvalo y seleccione Calcular mediante > País/Región.
Haga clic en Descripción en la tarjeta Marcas y agregue una fila para la predicción de MODEL_QUANTILE:
Asigne un nombre a la fila de descripción: Gasto de salud previsto de la esperanza de vida femenina:
Haga clic en Insertar y seleccione el cálculo para asegurarse de que la descripción mostrará dinámicamente la predicción única de la marca a medida que interactúa con la visualización.
Haga clic en Aceptar.
En este momento, nuestro cálculo de MODEL_QUANTILE solo tiene un predictor: la esperanza de vida femenina. Observe que a medida que se mueve de izquierda a derecha, viendo la descripción de las marcas con la misma esperanza de vida, todas tienen el mismo gasto de salud previsto. El gasto en salud previsto en Indonesia de la esperanza de vida es de 336 dólares, pero también lo son los de Fiji, los de Egipto y otros países que tienen la misma esperanza de vida femenina.
Esto se debe a que el modelo proporciona el mismo gasto estimado para cada marca. Puesto que solo estamos usando un predictor (esperanza de vida femenina), el modelo devuelve los mismos resultados para todas las marcas donde el predictor tiene el mismo valor. Puede agregar más matices al modelo agregando predictores.
Paso 3: agregar una predicción con un segundo predictor
A medida que cree sus predicciones, debe considerar qué campos serán buenos predictores para los valores de destino e incluirlos en los cálculos. Puede combinar cualquier número de dimensiones y medidas. Por ejemplo, podríamos agregar el PIB, la población y otros campos como predictores para mejorar nuestras predicciones. En este caso, vamos a agregar Región.
En el editor de cálculo, haga lo siguiente:
Nombre del cálculo: Gasto cuantitativo vs expectativa y región
Introduzca la siguiente fórmula, que es la misma que la del cálculo anterior, pero agrega Región como predictor:
POWER(10, MODEL_QUANTILE(0.5, LOG(MEDIAN([Health Exp/Capita])), AVG([Life Expectancy Female]), ATTR([Region])))
Haga clic en Aceptar.
A continuación, agregue el nuevo cálculo a Descripción en la tarjeta Marcas.
Haga clic en Descripción y agregue otra línea para describir la nueva predicción, como Gasto de salud previsto de la esperanza de vida femenina y región:
Ahora la información sobre herramientas muestra ambas predicciones.
Paso 4: comparar valores reales con valores predichos
Como último paso en el análisis, también puede crear cálculos de predicción que combinen valores reales y predichos. En nuestro ejemplo, vamos a mostrar los gastos de salud reales cuando están disponibles y los gastos estimados cuando no están disponibles.
En el editor de cálculo, haga lo siguiente:
Nombre el cálculo: Gasto de salud real vs valor de predicción
Introduzca la siguiente fórmula, que devolverá el valor numérico de la predicción:
ROUND(IFNULL(AVG([Health Exp/Capita]),[Quantile_HE/Cap_LEF,Region]),0)
Haga clic en Aceptar.
Cree otro cálculo de la siguiente manera:
Nombre del cálculo: Gasto de salud real vs categoría de predicción
Introduzca la siguiente fórmula, que actuará como etiqueta para el cálculo anterior:
STR(IF ISNULL(AVG([Health Exp/Capita])) THEN "(Estimate)" ELSE "(Actual)" END)
Haga clic en Aceptar.
A continuación, agregue ambos cálculos a Descripción en la tarjeta Marcas.
Haga clic en Descripción y agregue otra línea para describir los nuevos cálculos:
Gastos de salud per cápita (reales o estimados):
Inserte los nuevos cálculos, uno tras otro.
Haga clic en Aceptar.
Ahora, a medida que interactúa con la visualización, puede ver el gasto sanitario per cápita de cada país o ver una estimación si faltaba el valor real (nulo) de los datos.
De este modo, puede utilizar funciones de modelado predictivo en Tableau para obtener información sobre sus datos.