Como funciona a previsão no Tableau

A previsão no Tableau usa uma técnica conhecida como suavização exponencial. Os algoritmos de previsão tentam encontrar um padrão regular em medidas que podem ser continuadas no futuro. Se você está interessado em modelagem preditiva, também disponível no Tableau, veja Como funcionam as funções de modelagem preditiva no Tableau.

Normalmente, você pode adicionar uma previsão a uma exibição com um campo de data e, no mínimo, uma medida. Entretanto, na ausência de uma data, o Tableau pode criar uma previsão para uma exibição que contenha uma dimensão com valores inteiros, além de pelo menos uma medida.

Para obter detalhes sobre a criação de uma previsão, consulte Criar uma previsão. Para obter detalhes usando uma dimensão integral, consulte Previsão quando não houver data na exibição.

Visão geral

Todos os algoritmos de previsão são modelos simples de um processo de geração de dados real (DGP). Para uma previsão de alta qualidade, um padrão simples no DGP deve coincidir com o padrão descrito pelo modelo razoavelmente bem. As métricas de qualidade medem quão bem o modelo coincide com o DGP. Se a qualidade estiver baixa, a precisão medida pelas faixas de confiança não é importante porque mede a precisão de uma estimativa imprecisa.

O Tableau seleciona automaticamente o melhor de até oito modelos, o melhor sendo aquele que gera a previsão da mais alta qualidade. Os parâmetros de suavização de cada modelo são otimizados antes de o Tableau avaliar a qualidade da previsão. O método de otimização é global. Portanto, escolher localmente os parâmetros de suavização ideais que também não são globalmente ideais não é impossível. No entanto, os parâmetros de valor inicial são selecionados de acordo com as melhores práticas, mas não são mais otimizados. Então, é possível que os parâmetros de valor inicial sejam menos que ideais. Os oito modelos disponíveis no Tableau estão entre aqueles descritos no seguinte local do site do OTexts: Uma taxonomia de métodos de suavização exponenciais.(O link abre em nova janela)

Quando não há dados suficientes na visualização, o Tableau tenta prever automaticamente a uma granularidade temporal mais fina e depois reagrega a previsão à granularidade da visualização. O Tableau fornece faixas de previsão que podem ser simuladas ou calculadas de uma equação de forma fechada. Todos os modelos com um componente multiplicativo ou com previsões agregadas têm faixas simuladas, enquanto todos os outros modelos usam equações de forma fechada.

Suavização exponencial e tendência

A Suavização exponencial modela repetidamente os valores futuros da previsão de uma série do período regular de valores a partir de médias ponderadas de valores passados da série. O modelo mais simples, Suavização exponencial simples, calcula o próximo valor suavizado ou de nível a partir de um média ponderada do último valor real e do último valor de nível. O método é exponencial porque o valor de cada nível é influenciado por cada valor real precedente para um grau exponencialmente decrescente – valores mais recentes recebem peso maior.

Modelos de suavização exponencial com componentes de tendência ou sazonal são efetivos quando a medida a ser prevista exibe tendência ou sazonalidade no período no qual a previsão se baseia. Tendência é uma tendência nos dados a ser aumentada ou diminuída com o tempo. Sazonalidade é uma variação repetitiva e previsível no valor, como flutuação anual na temperatura relativa à sazonalidade.

Em geral, quanto mais pontos de dados você tiver na sua série de tempo, melhor será a previsão resultante. Ter dados suficientes é especialmente importante se você desejar modelar a sazonalidade, pois o modelo é mais complicado e requer mais provas na forma de dados para atingir um nível razoável de precisão. Por outro lado, se você fizer uma previsão usando dados gerados por dois ou mais DGPs diferentes, obterá uma previsão de menor qualidade, porque somente um DGP poderá se combinar a um modelo.

Sazonalidade

O Tableau testa um ciclo sazonal com a duração mais comum da agregação de tempo da série do período para a qual a previsão foi estimada. Portanto, se você fizer uma agregação por meses, o Tableau vai procurar um ciclo de 12 meses, se fizer a agregação por trimestres, o Tableau vai procurar um ciclo de quatro trimestres, e se a agregação for feita por dias, o Tableau vai procurar a sazonalidade semanal. Por isso, se houver um ciclo de seis meses em sua série de período mensal, o Tableau provavelmente encontrará um padrão de 12 meses contendo dois subpadrões semelhantes. No entanto, se houver um ciclo de sete meses em sua série de período mensal, o Tableau provavelmente não encontrará nenhum ciclo. Felizmente, os ciclos de sete meses são incomuns.

O Tableau pode usar um dos dois métodos disponíveis para se obter a duração da sazonalidade. O método temporal original usa a duração da sazonalidade da granularidade temporal (GT) da exibição. A granularidade temporal representa a melhor unidade de tempo expressada pela exibição. Por exemplo, se a exibição contiver uma data verde contínua concatenada ao mês ou partes de data de mês e ano em azul claro, a granularidade temporal da exibição será o mês. O novo método não temporal, apresentado no Tableau 9.3, usa a regressão periódica para verificar a duração da sazonalidade de 2 a 60 para durações candidatas.

O Tableau seleciona automaticamente o método mais apropriado para uma determinada exibição. Quando o Tableau estiver usando uma data para ordenar as medidas em uma exibição, se a granularidade temporal for trimestral, mensal, semanal, diária ou horária, as durações da sazonalidade serão quase certamente 4, 12, 13, 7 ou 24, respectivamente. Portanto, somente a duração natural ao TG é usada para criar cinco modelos de suavização exponencial de sazonalidade aceitos pelo Tableau. O AIC dos cinco modelos sazonais e dos três modelos não sazonais são comparados e o menor é retornado. (Para obter uma explicação da métrica AIC, consulte Descrições da previsão.)

Quando o Tableau estiver usando uma dimensão inteira para previsão, o segundo método será usado. Neste caso, não há granularidade temporal (TG), portanto as durações de sazonalidade potenciais devem ser derivadas dos dados.

O segundo método também será usado se a granularidade temporal for anual. As séries anuals raramente têm sazonalidade, mas, caso tenham, ela também deve ser derivada dos dados.

O segundo método também será usado para exibições com granularidade temporal de minuto ou segundo. Se tais séries tiverem sazonalidade, as durações da sazonalidade serão provavelmente 60. Entretanto, na medição de um processo real regular, poderá ocorrer uma repetição regular que não corresponda ao relógio. Portanto, para minutos e segundos, o Tableau também verifica uma duração diferente de 60 nos dados. Isto não significa que o Tableau pode modelar duas durações de sazonalidade diferentes ao mesmo tempo. Em vez disso, dez modelos sazonais são estimados, cinco com uma duração de sazonalidade de 60 e outros cinco com duração de sazonalidade derivada dos dados. Um dos dez modelos sazonais ou três modelos não sazonais terá o menor AIC, e esse modelo será usado para calcular a previsão.

Para séries ordenadas por ano, minuto ou segundo, uma única duração de sazonalidade dos dados é testada caso o padrão seja razoavelmente evidente. Para séries ordenadas por números inteiros, até nove durações de sazonalidade potenciais um pouco menos evidentes são estimadas para todos os cinco modelos sazonais, e o modelo com o menor AIC é retornado. Se não houver candidatos de duração de sazonalidade prováveis, somente os modelos não sazonais serão estimados.

Como toda a seleção é automática quando o Tableau obtém dos dados as durações de sazonalidade potenciais, o Tipo de modelo padrão “Automático” no menu Tipo de modelo do diálogo Opções de previsão não é alterado. Selecionar “Automático sem sazonalidade” melhora o desempenho ao eliminar toda a busca e estimativa de duração de sazonalidade dos modelos sazonais.

A heurística que o Tableau usa para decidir quando usar as durações de sazonalidade derivadas dos dados depende da distribuição de erros para regressão periódica de cada duração de sazonalidade candidata. Como o agrupamento de candidatos de duração de sazonalidade por regressão periódica normalmente produz uma ou mais durações vencedoras evidentes, caso a sazonalidade exista realmente nos dados, o retorno de um único candidato indica sazonalidade provável. Neste caso, o Tableau estima modelos sazonais com este candidato por granularidade de ano, minuto e segundo. O retorno de menos que o máximo de dez candidatos indica uma possível sazonalidade. Neste caso, o Tableau estima modelos sazonais com todos os candidatos retornados por exibições ordenadas de inteiros. O retorno do número máximo de candidatos indica que os erros para a maioria das durações sejam similares. Portanto, a existência de qualquer sazonalidade é improvável. Neste caso, o Tableau estima somente modelos sazonais para uma série ordenada por inteiros ou por ano e somente os modelos sazonais com uma duração sazonal natural para outras exibições ordenadas de forma temporal.

Para o tipo de modelo “Automático” em exibições ordenadas por inteiros, ano, minuto e segundo, as durações sazonais candidatas são sempre derivadas dos dados, independentemente de eles serem ou não usados. Como a estimativa de modelo é muito mais demorada que a regressão periódica, o impacto de desempenho deve ser moderado.

Tipos de modelo

Na caixa de diálogo Opções de previsão, você pode escolher o tipo de modelo que os usuários do Tableau utilizam na previsão. A configuração Automático costuma ser ideal para a maioria das exibições. Caso escolha Personalizado , você pode especificar a tendência e as características da temporada de maneira independente, escolhendo Nenhum, Aditivo ou Multiplicativo:

Um modelo aditivo é um no qual as contribuições dos componentes de modelo são resumidas, enquanto um modelo multiplicativo é aquele no qual pelo menos algumas contribuições de componente são multiplicadas. Os modelos multiplicativos podem melhorar significativamente a qualidade de previsão para dados em que a tendência ou a sazonalidade é afetada pelo nível (magnitude) dos dados:

Lembre-se de que você não precisa criar um modelo personalizado para gerar uma previsão que seja multiplicativa: a configuração Automático pode determinar se uma previsão multiplicativa é apropriada para seus dados. No entanto, um modelo multiplicativo não pode ser computado quando a medida a ser prevista tem um ou mais valores menor que ou igual a zero.

Previsão com o tempo

Quando estiver fazendo a previsão com uma data, poderá haver somente uma data de base na exibição. As datas de parte são aceitas, mas todas as partes devem se referir ao mesmo campo subjacente. As datas podem estar em Linhas, Colunas ou Marcas (com exceção do destino Dicas de ferramenta).

O Tableau aceita três tipos de datas, duas delas podem ser usadas para previsão:

  • Datas truncadas referem a um determinado ponto na história com granularidade temporal específica, como fevereiro de 2017. Elas são normalmente contínuas com um fundo verde na exibição. As datas truncadas são válidas para previsão.

  • As partes de data referem-se a um determinado membro de uma medida temporal, como fevereiro. Cada parte de data é representada por um campo diferente e normalmente discreto (com fundo azul). A previsão requer pelo menos uma parte de data Ano. Especificamente, ela pode usar qualquer um dos conjuntos a seguir de partes de datas para previsão:

    • Ano

    • Ano + trimestre

    • Ano + mês

    • Ano + trimestre + mês

    • Ano + semana

    • Personalizado: Mês/Ano, Mês/Dia/Ano

    Outras partes de dados, como Trimestral ou Trimestral + mês, não são válidas para previsão. Consulte Converter campos entre discretos e contínuos para obter mais detalhes sobre tipos de datas diferentes.

  • As datas exatas referem-se a um determinado ponto na história, com granularidade temporal máxima, como fevereiro 1, 2012 às 14:23:45.0. As datas exatas são inválidas para previsão.

Também é possível prever sem uma data. Consulte Previsão quando não houver data na exibição.

Granularidade e descarte

Ao criar uma previsão, você seleciona uma dimensão de data que especifica uma unidade de tempo na qual os valores de data serão medidos. As datas do Tableau oferecem suporte a uma variedade de unidades de tempo, incluindo Ano, Trimestre, Mês e Dia. A unida escolhida para o valor de data é conhecida como granularidade da data.

Normalmente, os dados na sua medida não se alinham precisamente com sua unidade de granularidade. Você pode definir o valor de data para trimestres, mas a data real pode terminar no meio de um trimestre, por exemplo, no fim de novembro. Isso pode causar um problema porque o valor para esse trimestre fracionário é tratado pelo modelo de previsão como um trimestre completo, que, normalmente, tem um valor mais baixo do que teria um trimestre completo. Se o modelo de previsão tiver permissão para considerar esses dados, a previsão resultante será imprecisa. A solução é descartar os dados, de modo que os períodos posteriores que poderiam enganar a previsão sejam ignorados. Use a opção Ignorar último na caixa de diálogo Opções de previsão para remover, ou descartar, tais períodos parciais. O padrão é descartar um período.

Como obter mais dados

O Tableau exige pelo menos cinco pontos de dados na série do período para estimar uma tendência, bem como pontos de dados suficientes para pelo menos duas sazonalidades ou uma sazonalidade além dos cinco períodos para estimar a sazonalidade. Por exemplo, pelo menos nove pontos de dados são exigidos para estimar um modelo com um ciclo sazonal de quatro trimestres (4 + 5) e pelo menos 24 para estimar um modelo com um ciclo sazonal de doze meses (2 * 12).

Se você ativar a previsão para uma exibição que não tenha pontos de dados suficientes para oferecer suporte a uma boa previsão, às vezes, o Tableau poderá recuperar pontos de dados suficientes para gerar uma previsão válida consultando a fonte de dados em busca de um nível mais refinado de granularidade.

  • Se sua exibição contiver menos de nove anos de dados, por padrão, o Tableau vai consultar a fonte de dados em busca de dados trimestrais, estimar uma previsão trimestral e agregar a uma previsão anual a ser mostrada na exibição. Se ainda assim não houver pontos de dados suficientes, o Tableau vai estimar uma previsão mensal e retornar a previsão anual agregada para sua exibição.

  • Se sua exibição contiver menos de nove trimestres de dados, por padrão, o Tableau vai estimar uma previsão mensal e retornar os resultados da previsão trimestral agregada para sua exibição.

  • Se sua exibição contiver menos de nove semanas de dados, por padrão, o Tableau vai estimar uma previsão diária e retornar os resultados da previsão semanal agregada para sua exibição.

  • Se sua exibição contiver menos de nove dias de dados, por padrão, o Tableau irá estimar uma previsão por hora e retornar os resultados da previsão diária agregados para sua exibição.

  • Se sua exibição contiver menos de nove horas de dados, por padrão, o Tableau irá estimar uma previsão por minuto e retornar os resultados da previsão por hora agregados para sua exibição.

  • Se sua exibição contiver menos de nove minutos de dados, por padrão, o Tableau irá estimar uma previsão por segundo e retornar os resultados da previsão por minuto agregados para sua exibição.

Esses ajustes acontecem em segundo plano e não exigem configuração. O Tableau não altera a aparência da sua visualização e, de fato, não altera o valor de data. No entanto, o resumo do período de tempo de previsão na caixa de diálogo Previsão e Opções de previsão refletirá a granularidade real usada.

O Tableau pode obter mais dados apenas quando a agregação para a medida que você está prevendo for SUM ou COUNT. Consulte Agregação de dados no Tableau para obter informações sobre tipos de agregação disponíveis e informações sobre como alterar o tipo de agregação.

Agradecemos seu feedback!Seu feedback foi enviado. Obrigado!