Modelagem preditiva com marcas geradas
Se você já usa o Tableau há algum tempo, talvez já tenha ouvido a frase “densificação de dados”. Isso se refere a um processo em que marcas são geradas pelo Tableau e adicionadas à exibição, embora essas marcas não sejam aceitas pelos registros na fonte de dados subjacente. Pode ser feito para estender um eixo de data ou, se você estiver trabalhando com funções de modelagem preditiva, para mostrar previsões.
Saiba mais: veja esta publicação no blog sobre densificação de dados da Data Plus Science.
Cálculo de previsões sobre valores ausentes
Por exemplo, você pode querer adicionar previsões para datas futuras. Por padrão, os valores ausentes no Tableau não são mostrados, mas você pode gerar essas marcas da seguinte forma:
Clique com o botão direito do mouse (clique pressionando a tecla Control, no Mac) na data ou no cabeçalho do compartimento.
Selecione Mostrar valores ausentes.
Mas isso não é suficiente para permitir que você faça previsões sobre essas marcas geradas. Se você tentasse realizar um cálculo sobre elas (seja um cálculo de previsão ou não), o Tableau devolveria valores nulos. Isso é esperado, uma vez que essas marcas são baseadas em valores ausentes que não existem.
Para fazer previsões sobre esse valores ausentes, abra o menu Análise na parte superior e selecione Inferir propriedades de valores ausentes.
Exemplo de previsões sobre marcas geradas
Agora vamos conhecer melhor esse comportamento. Vamos comparar três ilustrações diferentes indicando como as configurações Mostrar valores ausentes e Inferir propriedades de valores ausentes podem afetar a visualização, dependendo se uma ou ambas estão ativadas ou desativadas. Para acompanhar, baixe a seguinte pasta de trabalho no Tableau Public: Previsões sobre valores ausentes.
Incluímos previsões usando ATTR(DAY([Order Date) como preditor. Esse não é o melhor preditor para os dados (e produz previsões inadequadas), mas para a finalidade deste artigo, é uma boa ilustração de Inferir propriedades de valores ausentes.
Cada visualização inclui as mesmas quatro medidas da divisória Linhas, conforme descrito abaixo:
- Linha 1:
SUM([Profit])
- Linha 2:
RUNNING_SUM(SUM([Profit]))
- Linha 3:
ATTR(DAY([Order Date]))
- Linha 4:
MODEL_QUANTILE(0.5, SUM([Profit]),ATTR(DAY([Order Date])))
Ilustração 1
Na imagem acima, as configurações Mostrar valores ausentes e Inferir propriedades de valores ausentes estão desativadas, o que corresponde ao padrão no Tableau.
Você veria a mesma visualização, se Inferir propriedades de valores ausentes estivesse ativada e Mostrar valores ausentes estivesse desativada. Isso ocorre porque Inferir propriedades de valores ausentes depende da ativação de Mostrar valores ausentes.
Ilustração 2
Na imagem acima, Mostrar valores ausentes está ativada e Inferir propriedades de valores ausentes está desativada. Por padrão, a configuração Inferir propriedades de valores ausentes fica desativada, mesmo que Mostrar valores ausentes esteja ativada.
Observe que nessa situação, não calculamos um valor para ATTR no DAY([Order Date]) para os valores ausentes (Linha 3). Geramos uma previsão para as datas densificadas, mas elas são idênticas para todas as datas ausentes, já que não é possível inferir o ATTR(DAY([Order Date]), como mostrado na linha 3. Efetivamente, essas marcas estão sendo contabilizadas como se DAY([Order Date]) fosse nulo.
Ilustração 3
Nesta imagem, Mostrar valores ausentes e Inferir propriedades de valores ausentes estão ativadas, ilustrando a configuração Inferir propriedades de valores ausentes em ação.
Como você pode ver, como foi possível inferir o ATTR(DAY([Order Date]) (Linha 3), podemos usá-lo nas previsões da Linha 4, o que retorna uma bela curva suave de previsões.