Exemplo - Explore a expectativa de vida das mulheres com as funções de modelagem preditiva
Este exemplo usa a fonte de dados salva Indicadores Mundiais, que acompanha o Tableau. Usaremos as funções de modelagem preditiva MODEL_QUANTILE e MODEL_PERCENTILE para explorar as relações entre despesas com saúde per capita, expectativa de vida das mulheres e taxa de natalidade.
Vamos começar com uma visualização que compara as despesas com saúde de cada país com a expectativa de vida das mulheres. Para acessar e acompanhar as exibições e os painéis pré-criados ou para exibir a solução, baixe a seguinte pasta de trabalho do Tableau Public: Modelo preditivo da expectativa de vida das mulheres.
Uso de MODEL_PERCENTILE
Primeiro vamos avaliar a expectativa de vida e as despesas com saúde para todas as marcas visíveis. Isso permitirá que o Tableau crie um modelo a partir dessas marcas e retorne o percentil para cada uma dentro do modelo.
Etapa 1: criar o cálculo de previsão
Se você também tiver o Tableau Server ou Tableau Cloud e quiser fazer a criação na Web, em vez de fazê-la no Tableau Desktop, publique a pasta de trabalho no servidor do Tableau, clique em Pastas de trabalho, selecione a pasta de trabalho, em seguida, clique em Ações e escolha Editar pasta de trabalho.
Após abrir a pasta de trabalho, você verá que ela tem várias planilhas. Você usará essas planilhas para criar as exibições.
Na pasta de trabalho do iniciador, clique na planilha Percentil do iniciador.
Abra o menu Análise na parte superior e selecione Criar campo calculado.
No Editor de cálculo, faça o seguinte:
Nomeie o cálculo: Percentil de expectativa versus despesas
Insira a fórmula a seguir:
MODEL_PERCENTILE(AVG([Life Expectancy Female]), LOG(MEDIAN([Health Exp/Capita])))
Clique em OK.
Agora o cálculo da previsão é adicionado como campo calculado no painel Dados.
Este cálculo utiliza a expectativa de vida média como expressão de destino e as despesas com saúde medianas como preditor. Nesse caso, utilizamos uma transformação logarítmica no eixo de despesas com saúde, bem como no preditor.
Etapa 2: adicionar o cálculo de previsão à exibição
Na visualização acima, você pode ver as despesas com saúde de cada país em relação à expectativa de vida das mulheres, filtradas para 2012.
Agora, vamos adicionar o cálculo MODEL_PERCENTILE à exibição e ver quais informações podemos obter.
Arraste Percentil de expectativa versus despesas até Cor no cartão Marcas.
Clique na seta suspensa da pílula e selecione Uso de computação > País/região.
Clique em Cor no cartão Marcas e, em seguida, clique em Editar cores.
Em Paleta, selecione Laranja-azul divergente.
Marque a caixa de seleção Cor gradativa.
Marque a caixa de seleção Invertido.
Clique em OK.
Você pode ver a distribuição de países onde a expectativa de saúde é maior e menor do que o esperado, com base no nível de despesas. Observe que, geralmente, as marcas vermelhas escuras indicam que a expectativa de vida é alta em relação às despesas com saúde, o azul escuro significa que a expectativa de vida é baixa em relação às despesas com saúde e cinza significa que a expectativa de vida está próxima do que o modelo espera, com base no nível de despesas com saúde.
Etapa 3: agrupar os resultados por cor
Para simplificar a análise, vamos usar o cálculo de previsão em um novo cálculo para agrupar os resultados. Criaremos grupos para que as marcas acima de 90% e abaixo de 10% sejam agrupadas. As marcas no intervalo de 80% a 90% e no intervalo de 10% a 20% estão agrupadas, e assim por diante. Também destacaremos as marcas com um valor nulo e as analisaremos posteriormente usando a outra função de modelagem preditiva, MODEL_QUANTILE.
No Editor de cálculo, faça o seguinte:
Nomeie o cálculo: Percentil por cor.
Insira a fórmula a seguir:
IF
ISNULL([Percentile Expectancy vs Spending])
THEN "Null"
ELSEIF [Percentile Expectancy vs Spending] >=0.9 OR
[Percentile Expectancy vs Spending] <=0.1
THEN "<10th & >90th percentile"
ELSEIF [Percentile Expectancy vs Spending] >=0.8 OR
[Percentile Expectancy vs Spending] <=0.2
THEN "<20th & >80th percentile"
ELSEIF [Percentile Expectancy vs Spending] >=0.7 OR
[Percentile Expectancy vs Spending] <=0.3
THEN "<30th & >70th percentile"
ELSEIF [Percentile Expectancy vs Spending] >=0.6 OR
[Percentile Expectancy vs Spending] <=0.4
THEN "<40th & >60th percentile"
ELSE "50th percentile +-10"
ENDAdicione o novo cálculo à Cor no cartão Marcas.
Clique na seta suspensa da pílula e selecione Uso de computação > País/região.
Clique em Cor no cartão Marcas e, em seguida, clique em Editar cores.
Ajuste as cores para ver melhor a tendência. Nesse caso, vamos usar a paleta de cores Semáforo e usaremos cinza para Nulos.
Clique em OK.
Olhando para a marca laranja no canto, observe que os EUA gastam US$ 8.895,00 por mulher para uma expectativa de vida de 81 anos. Percorrendo o eixo X para a esquerda, você pode ver que outros países gastam menos e têm a mesma expectativa de vida.
O modelo avalia a força da relação em cada ponto, onde os EUA estão próximos da extremidade superior do intervalo esperado do modelo.
Etapa 4: comparar a expectativa de vida com a taxa de natalidade
Em seguida, vamos olhar uma visualização que compara a expectativa de vida das mulheres com a taxa de natalidade. Observe que há uma correlação negativa entre as taxas de natalidade e a expectativa de vida das mulheres. No entanto, isso não significa que taxas de natalidade mais altas causem menor expectativa de vida das mulheres. Provavelmente, há fatores adicionais que afetam tanto as taxas de natalidade quanto a expectativa de vida das mulheres e que não são visíveis nessa exibição dos dados. Mas vamos adicionar o modelo e ver onde o modelo espera que a expectativa de vida das mulheres seja maior ou menor, considerando as despesas com saúde.
Na planilha Taxa de natalidade, adicione o cálculo de previsão Percentil por cor à Cor no cartão Marcas para trazê-lo para a exibição.
Clique na seta suspensa da pílula e selecione Uso de computação > País/região.
Clique em Cor no cartão Marcas e selecione Editar cores. Edite as cores como anteriormente, usando a paleta Semáforo e cinza para Nulo.
Clique em OK.
Agora os dados estão muito mais distribuídos. A faixa vermelha no canto inferior direito é onde a expectativa de vida é mais baixa, mas a taxa de natalidade é mais alta e as despesas com saúde em relação à expectativa de vida são baixas. Destacando as duas marcas vermelhas no quadrante superior esquerdo, que pertencem à Albânia e à Armênia, você notará que ambos os países têm uma alta expectativa de vida das mulheres, taxas de natalidade menores e baixas despesas com saúde.
Como você pode ver, pudemos usar MODEL_PERCENTILE para identificar que esses dois países são exceções: embora ambos tenham despesas com saúde relativamente baixas, ainda têm expectativas de vida relativamente altas, colocadas no contexto da taxa de natalidade.
Agora, vamos ver como você pode usar a outra função de modelagem preditiva, MODEL_QUANTILE, para continuar a análise.
Uso de MODEL_QUANTILE
A função MODEL_QUANTILE é usada para gerar previsões numéricas, considerando um percentil de destino, a expressão de destino e os preditores. É o inverso de MODEL_PERCENTILE.
Lembre-se que temos vários valores nulos em nossos resultados, o que significa que alguns países não têm dados de despesas com saúde. Usaremos MODEL_QUANTILE para estimar os valores ausentes.
Etapa 1: criar os cálculo de previsão
Estamos trabalhando com este cálculo:
MODEL_PERCENTILE(AVG([Life Expectancy Female]), LOG(MEDIAN([Health Exp/Capita])))
Em primeiro lugar, queremos inverter essa função para obter uma previsão para as despesas com saúde, com base na expectativa de vida das mulheres.
Na pasta de trabalho do iniciador, clique na planilha Quantil do iniciador.
Abra o menu Análise na parte superior e selecione Criar campo calculado.
No Editor de cálculo, faça o seguinte:
- Nomeie o cálculo: Quantil de expectativa de vida versus despesas
Insira a fórmula a seguir:
POWER(10, MODEL_QUANTILE(0.5, LOG(MEDIAN([Health Exp/Capita])), AVG([Life Expectancy Female])))
Vamos dividir esse cálculo para melhor entendê-lo:
- Começamos com MODEL_QUANTILE, onde o primeiro argumento é 0,5, especificando qual percentil deve ser previsto.
- A expressão de destino corresponde às despesas com saúde per capita medianas.
- O preditor é a expectativa de vida das mulheres média.
- Além disso, envolvemos a função dentro de uma função POWER para converter a expressão de destino transformada em log novamente para dólares.
Clique em OK.
Agora o cálculo da previsão é adicionado como campo calculado no painel Dados.
Etapa 2: adicionar o cálculo de previsão à exibição
Arraste Quantil de expectativa versus despesas até Dica de ferramenta no cartão Marcas.
Clique na seta suspensa da pílula e selecione Uso de computação > País/região.
Clique em Dica de ferramenta no cartão Marcas e adicione uma linha para a previsão de MODEL_QUANTILE:
Nomeie a linha de dica de ferramentas: Despesas com saúde previstas a partir da expectativa de vida das mulheres:
Clique em Inserir e selecione o cálculo para garantir que a dica da ferramenta mostre dinamicamente a previsão única da marca, à medida que você interage com a visualização.
Clique em OK.
Neste momento, nosso cálculo MODEL_QUANTILE só tem um preditor: expectativa de vida das mulheres. À medida que você se move da esquerda para a direita, exibindo a dica de ferramenta para as marcas com a mesma expectativa de vida, observe que cada uma tem as mesmas despesas com saúde previstas. As despesas com saúde previstas a partir da expectativa de vida da Indonésia são US$ 336,00, mas também são as de Fiji, do Egito e de outros países que têm a mesma expectativa de vida das mulheres.
Isso porque o modelo fornece as mesmas despesas estimadas para cada marca. Como estamos usando apenas um preditor (expectativa de vida das mulheres), o modelo retorna os mesmos resultados para todas as marcas em que o preditor tem o mesmo valor. Você pode adicionar mais nuances ao modelo, adicionando preditores.
Etapa 3: adicionar uma previsão com um segundo preditor
À medida que você cria as previsões, deve considerar quais campos serão bons preditores para os valores de destino e incluí-los nos cálculos. Você pode combinar qualquer número de dimensões e medidas. Por exemplo, poderíamos adicionar PIB, população e outros campos como preditores para melhorar nossas previsões. Neste caso, vamos adicionar Região.
No Editor de cálculo, faça o seguinte:
Nomeie o cálculo: Quantil de despesas versus expectativa e região
Digite a seguinte fórmula, que é a mesma do cálculo anterior, mas adiciona Região como preditor:
POWER(10, MODEL_QUANTILE(0.5, LOG(MEDIAN([Health Exp/Capita])), AVG([Life Expectancy Female]), ATTR([Region])))
Clique em OK.
Em seguida, adicione o novo cálculo à dica de ferramenta no cartão Marcas.
Clique em Dica de ferramenta e adicione outra linha para descrever a nova previsão, como Despesas com saúde previstas a partir da Expectativa de vida das mulheres e Região.
Agora a dica de ferramenta mostra ambas as previsões.
Etapa 4: comparar valores reais com valores previstos
Como a etapa final da análise, você também pode criar cálculos de previsão que combinam valores reais e previstos. Em nosso exemplo, vamos mostrar as despesas com saúde reais, quando disponíveis, e as despesas estimadas, quando indisponíveis.
No Editor de cálculo, faça o seguinte:
Nomeie o cálculo: Despesas com saúde reais versus valor de previsão
Digite a seguinte fórmula, que retornará o valor numérico da previsão:
ROUND(IFNULL(AVG([Health Exp/Capita]),[Quantile_HE/Cap_LEF,Region]),0)
Clique em OK.
Crie outro cálculo da seguinte forma:
Nomeie o cálculo: Despesas com saúde reais versus marca de previsão
Digite a seguinte fórmula, que atuará como rótulo para o cálculo acima:
STR(IF ISNULL(AVG([Health Exp/Capita])) THEN "(Estimate)" ELSE "(Actual)" END)
Clique em OK.
Em seguida, adicione os dois cálculo à Dica de ferramenta no cartão Marcas.
Clique em Dica de ferramenta e adicione outra linha para descrever os novos cálculos:
Despesas com saúde per capita (reais ou estimadas):
Insira os novos cálculos, um após o outro.
Clique em OK.
Agora, à medida que você interage com a visualização, pode ver as despesas com saúde per capita de cada país ou exibir uma estimativa, caso o valor real esteja ausente (nulo) nos dados.
Simples assim, você pode usar as funções de modelagem preditiva no Tableau para obter informações sobre os dados.