Cómo funcionan los pronósticos en Tableau

Los pronósticos en Tableau utilizan una técnica conocida como homogenización exponencial. Los algoritmos de pronóstico tratan de buscar un patrón regular en medidas que puedan continuarse en el futuro. Si le interesa el modelado predictivo, también disponible en Tableau, consulte Funciones de modelado predictivo en Tableau

Vea un vídeo: para consultar conceptos relacionados mostrados en Tableau, consulte Pronóstico(Link opens in a new window), un vídeo de capacitación de seis minutos gratuito. Use su cuenta de tableau.com(Link opens in a new window) para iniciar sesión.

Normalmente se añade un pronóstico a una vista que contiene un campo de fecha y, como mínimo, una medida. Sin embargo, si no hay ninguna fecha, Tableau puede crear un pronóstico para una vista que contenga una dimensión con valores enteros y, como mínimo, una medida.

Para obtener más información sobre cómo crear un pronóstico, consulte Crear un pronóstico. Para obtener información detallada sobre cómo efectuar pronósticos con una dimensión de enteros, consulte Pronóstico cuando no hay fechas en la vista.

Descripción general

Todos los algoritmos de previsión son modelos simples de procesos de generación de datos (DGP) del mundo real. Para obtener una mayor calidad en la previsión, el patrón simple de DGP debe coincidir con el patrón que describe el modelo. Las métricas de calidad evalúan el grado de coincidencia de los modelos con el DGP. Si la calidad es baja, la precisión no es importante, ya que se evaluará la precisión de una estimación inexacta.

Tableau selecciona automáticamente los ocho mejores modelos, siendo el mejor el que genera la previsión de mayor calidad. Los parámetros de suavizado de cada modelo se optimizan antes de que Tableau evalúe la calidad de la previsión. El método de optimización es global. Por lo tanto, es posible seleccionar parámetros de suavizado localmente óptimos que no sean los mejores desde el punto de vista global. No obstante, los parámetros de valor inicial se seleccionarán según los procedimientos recomendados, aunque no se optimizarán. Por lo tanto, es posible que los parámetros del valor inicial no sean los óptimos. Los ocho modelos disponibles en Tableau se encuentran entre los descritos en la siguiente ubicación en el sitio web de OTexts: Taxonomía de métodos de suavizado exponencial(Link opens in a new window).

Cuando no hay suficientes datos en la visualización, Tableau intentará prever automáticamente con un nivel de detalle temporalmente alto e irá agregando el pronóstico en la granularidad de la visualización. Tableau ofrece bandas de pronósticos que se pueden simular o calcular desde una ecuación de formulario cerrada. Todos los modelos que tengan un componente de multiplicación o con pronósticos agregados tendrán bandas simuladas, mientras que el resto de modelos usará las ecuaciones de formulario cerradas.

Homogeneización exponencial y tendencia

Los modelos de Homogenización exponencial pronostican de manera iterativa valores futuros de una serie de valores de tiempo regulares a partir de promedios ponderados de valores de series pasados. El modelo más sencillo, Homogenización exponencial simple, calcula el próximo nivel o valor homogéneo de un promedio ponderado del último valor real y el último valor de nivel. El método es exponencial porque el valor de cada nivel recibe la influencia de cada valor real precedente a un grado que disminuye exponencialmente. Los valores más recientes tienen mayor ponderación.

Modelos homogéneos exponenciales con componentes de tendencia o de temporada son efectivos cuando la medida que se pronosticará exhibe tendencias o temporalidad a lo largo del periodo de tiempo en el cual se basa el pronóstico. Tendencia es la tendencia que tienen los datos de aumentar o disminuir con el tiempo. Temporalidad es una variación repetitiva y predecible del valor, como una fluctuación anual en la temperatura en relación con la temporada.

En general, cuanto más puntos de datos tenga en su serie de tiempo, mejor será el pronóstico resultante. Es especialmente importante disponer de suficientes datos si desea modelar la temporalidad, ya que el modelo es más complicado y requiere más pruebas en forma de datos para lograr un nivel de precisión razonable. Además, si tiene previsto usar los datos generados por dos o más DGP distintos, obtendrá un pronóstico de menor calidad, ya que el modelo solo puede coincidir con uno.

Temporalidad

Tableau normalmente prueba un ciclo de temporada con la longitud más típica de la agregación de tiempo de la serie de tiempo para la que se estimó el pronóstico. Es decir, si agrega por meses, Tableau buscará un ciclo de 12 meses; si agrega por trimestres, Tableau buscará un ciclo de cuatro trimestres; y si agrega por días, Tableau buscará una temporalidad semanal. Por lo tanto, si existe un ciclo de seis meses en su serie de tiempo mensual, es probable que Tableau busque un patrón de 12 meses que contenga dos subpatrones similares. Sin embargo, si existe un ciclo de siete meses en su serie de tiempo mensual, es probable que Tableau no busque ningún ciclo. Afortunadamente, los ciclos de siete meses son poco comunes.

Tableau puede utilizar cualquiera de los dos métodos para obtener la longitud estacional. El método temporal original utiliza la longitud estacional natural de la granularidad temporal de la vista. Por granularidad temporal se entiende la unidad temporal más precisa expresada por la vista. Por ejemplo, si la vista contiene una fecha verde, continua y truncada por mes, o partes de fecha de año y mes, azules y discretas, la granularidad temporal de la vista será de mes. El nuevo método atemporal, introducido en Tableau 9.3, utiliza la regresión periódica para comprobar las longitudes estacionales comprendidas entre la 2 y la 60 para las longitudes candidatas.

Tableau selecciona automáticamente el método más adecuado para una determinada vista. Cuando Tableau emplea una fecha para ordenar las medidas de una vista, si la granularidad temporal es trimestral, mensual, semanal, diaria o por horas, las longitudes estacionales serán, casi seguro, 4, 12, 13, 7 o 24, respectivamente. Así pues, solo se utiliza la longitud natural para la granularidad temporal con el objetivo de crear los cinco modelos estacionales de homogeneización exponencial compatibles con Tableau. Los AIC de los cinco modelos estacionales y los tres modelos no estacionales se comparan y se devuelve el inferior (para ver una explicación de la métrica AIC, consulte Descripciones de pronósticos).

Cuando Tableau utiliza una dimensión de enteros para efectuar un pronóstico, se emplea el segundo método. En este caso no hay granularidad temporal, por lo que las longitudes estacionales potenciales deben derivarse de los datos.

El segundo método también se emplea si la granularidad temporal es anual. Las series anuales pocas veces tienen estacionalidad; sin embargo, si tienen, también deben derivarse de los datos.

El segundo método también se emplea en las vistas que tienen una granularidad temporal de minuto o segundo. Si dichas series tienen estacionalidad, las longitudes estacionales probablemente serán de 60. Sin embargo, si se mide un proceso real normal, este podría tener una repetición regular que no se corresponda con el reloj. Así pues, para los minutos y los segundos, Tableau también busca en los datos una longitud que no sea 60. Esto no quiere decir que Tableau pueda modelar dos longitudes estacionales distintas al mismo tiempo, sino que se estiman diez modelos estacionales, cinco con una longitud estacional de 60 y cinco más con la longitud estacional derivada de los datos. Sea cual sea el modelo estacional (de los diez disponibles) o el modelo no estacional (de los tres disponibles) que tenga el AIC más bajo, este se utilizará para calcular el pronóstico.

En las series ordenadas por año, minuto o segundo, se comprueba que el patrón sea bastante claro en una sola longitud estacional de los datos. En las series ordenadas por enteros, se estiman hasta nueve longitudes estacionales potenciales (algo menos claras) para los cinco modelos estacionales; asimismo, se devuelve el modelo que tiene el AIC más bajo. Si no hay ningún candidato de longitud estacional probable, solo se estimarán los modelos no estacionales.

Dado que todas las selecciones son automáticas cuando Tableau deriva longitudes estacionales potenciales desde los datos, el tipo de modelo predeterminado "Automático", que se encuentra en el menú Tipo de modelo del cuadro de diálogo Opciones de pronóstico, no cambia. Si selecciona “Automático sin temporalidad” se mejorará el rendimiento, ya que se eliminan todas las búsquedas de longitudes estacionales y todas las estimaciones de modelos estacionales.

La heurística que emplea Tableau para decidir cuándo debe usar las longitudes estacionales derivadas de los datos depende de la distribución de los errores de la regresión periódica de cada longitud estacional candidata. Dado que el ensamblaje de longitudes estacionales candidatas por regresión periódica suele generar una o dos longitudes claramente vencedoras en el caso de que los datos presenten estacionalidad, la devolución de un solo candidato indica una posible estacionalidad. En este caso, Tableau estima los modelos estacionales que tengan este candidato para la granularidad de año, minuto y segundo. La devolución de un valor inferior al máximo de diez candidatos indica una posible estacionalidad. En este caso, Tableau estima los modelos estacionales que tengan todos los candidatos devueltos para las vistas ordenadas por enteros. La devolución del número máximo de candidatos indica que los errores de la mayoría de las longitudes son similares. Por lo tanto, la existencia de cualquier estacionalidad es poco probable. En este caso, Tableau solo estima los modelos no estacionales para una serie ordenada por enteros o por año y los modelos estacionales que tengan una longitud estacional natural para el resto de las vistas ordenadas de forma temporal.

En el tipo de modelo “Automático” de las vistas ordenadas por enteros, años, minutos y segundos, las longitudes estacionales candidatas siempre se derivan de los datos, tanto si se utilizan como si no. Como la estimación de modelos requiere mucho más tiempo que la regresión periódica, el impacto en el rendimiento puede ser moderado.

Tipos de modelo

En el cuadro de diálogo Opciones de pronóstico, puede elegir el tipo de modelo que usarán los usuarios de Tableau para los pronósticos. La configuración Automático generalmente es óptima para la mayoría de las vistas. Si elige Personalizado , entonces puede especificar las características de tendencia y de temporada de forma independiente, eligiendo Ninguno, Aditivo o Multiplicativo:

Un modelo aditivo es uno en el que los contribuyentes a los componentes del modelo se suman, mientras que un modelo multiplicativo es uno en el cual al menos algunos contribuyentes de componentes se multiplican. Los modelos multiplicativos pueden mejorar la calidad del pronóstico de forma significativa para los datos en lo que las tendencias o la temporalidad se ve afectada por el nivel (magnitud) de los datos.

Tenga en mente que no necesita crear un modelo personalizado para generar un pronóstico multiplicativo: la configuración Automática puede determinar si un pronóstico multiplicativo es adecuado para sus datos. Sin embargo, un modelo multiplicativo no se puede calcular cuando la medida a pronosticar tiene uno o más valores iguales o menores que cero.

Pronósticos temporales

Cuando efectúa un pronóstico con una fecha, solo puede haber una fecha base en la vista. Las partes de fecha se admiten, pero todas ellas deben hacer referencia al mismo campo subyacente. Las fechas pueden estar en Filas, Columnas o Marcas (con la excepción del objetivo de la descripción emergente).

Tableau admite tres tipos de fechas, dos de las cuales pueden utilizarse en los pronósticos:

  • Las fechas truncadas hacen referencia a un punto determinado en la historia con una granularidad temporal específica (por ejemplo, febrero de 2017). Suelen ser continuas y tienen el color de fondo verde en la vista. Las fechas truncadas son válidas para los pronósticos.

  • Las partes de fecha hacen referencia a un miembro concreto de una medida temporal como, por ejemplo, febrero. Cada parte de fecha se representa con un campo diferente, normalmente discreto (con el color de fondo azul). Los pronósticos requieren como mínimo una parte de fecha de año. Concretamente, puede utilizar cualquiera de los siguientes conjuntos de partes de fecha para efectuar pronósticos:

    • Año

    • Año + trimestre

    • Año + mes

    • Año + trimestre + mes

    • Año + semana

    • Personalizado: Mes/año, mes/día/año

    Hay otras partes de fecha, como Trimestre o Trimestre + mes, que no son válidas para efectuar pronósticos. Consulte Convertir campos a discretos o continuos para obtener más información detallada sobre los distintos tipos de datos.

  • Las fechas exactas hacen referencia a un punto determinado en la historia con una granularidad temporal máxima como, por ejemplo, 1 de febrero de 2012 a las 14:23:45.0. Las fechas exactas no son válidas para efectuar pronósticos.

También se puede efectuar un pronóstico sin fechas. Consulte Pronóstico cuando no hay fechas en la vista.

Granularidad y acotación

Cuando crea un pronóstico, selecciona una dimensión de fecha que especifica una unidad de tiempo según la cual se medirán los valores de fecha. Las fechas de Tableau admiten un rango de unidades de tiempo entre las que se incluyen Año, Trimestre, Mes y Día. La unidad que selecciona para el valor de fecha se conoce como la granularidad de la fecha.

La fecha en su medida normalmente no se alinea de forma exacta con la unidad de granularidad. Puede definir el valor de fecha en trimestres, pero sus datos reales pueden terminar a la mitad de un trimestre, por ejemplo, a fines de noviembre. Esto puede causar un problema porque el modelo de pronóstico trata el valor para esta parte del trimestre como un trimestre completo, lo que normalmente tendrá un valor inferior de lo que tendría un trimestre completo. Si el modelo de pronóstico tiene permitido considerar estos datos, el pronóstico resultante no será exacto. La solución es acotar los datos, de modo que se ignoren los períodos posteriores que podrían inducir a errores en el pronóstico. Utilice la opción Ignorar último en el cuadro de diálogo Opciones de pronóstico para eliminar o acotar esos períodos parciales. El valor predeterminado es acotar un período.

Obtener más datos

Tableau necesita al menos cinco puntos de datos en la serie de tiempo para estimar una tendencia y suficientes puntos de datos para al menos dos temporadas o una temporada más cinco períodos para estimar la temporalidad. Por ejemplo, se requieren al menos nueve puntos de datos para estimar un modelo con un ciclo de temporada de cuatro trimestres (4 + 5), y al menos 24 para estimar un modelo con un ciclo de temporada de doce meses (2 * 12).

Si activa el pronóstico para una vista que no tiene suficientes puntos de datos para generar un buen pronóstico, algunas veces Tableau puede recuperar suficientes puntos de datos para producir un pronóstico válido al consultar la fuente de datos para obtener un mejor nivel de granularidad.

  • De manera predeterminada, si su vista contiene menos de nueve años de datos, Tableau consultará la fuente de datos para buscar datos trimestrales, estimar un pronóstico trimestral y agregar a un pronóstico anual para mostrarlo en su vista. Si aún no hay suficientes puntos de datos, Tableau estimará un pronóstico mensual y mostrará en su vista el pronóstico anual agregado.

  • De manera predeterminada, si su vista contiene menos de nueve trimestres de datos, Tableau estimará un pronóstico mensual y mostrará los resultados del pronóstico trimestral agregado en su vista.

  • De manera predeterminada, si su vista contiene menos de nueve semanas de datos, Tableau estimará un pronóstico diario y mostrará los resultados del pronóstico semanal agregado en su vista.

  • Si su vista contiene menos de nueve días de datos, Tableau estimará de forma predeterminada un pronóstico cada una hora y mostrará los resultados de los pronósticos diarios agregados en su vista.

  • Si su vista contiene menos de nueve horas de datos, Tableau estimará de forma predeterminada un pronóstico por minuto y mostrará los resultados del pronóstico por hora agregado en su vista.

  • Si su vista contiene menos de nueve minutos de datos, Tableau estimará de forma predeterminada un pronóstico cada una segundo y mostrará los resultados de los pronósticos por minuto agregados en su vista.

Estos ajustes ocurren de fondo y no necesitan configuración. Tableau no cambia la apariencia de la visualización y, en realidad, no cambia el valor de fecha. Sin embargo, el resumen del período de tiempo de pronóstico en el cuadro de diálogo Describir pronóstico y Opciones de pronóstico reflejará la granularidad real utilizada.

Tableau solo puede obtener más datos cuando la agregación para la medida que está pronosticando es SUM o COUNT. Consulte Agregación de datos en Tableau para obtener información sobre los tipos de agregaciones disponibles y sobre cómo cambiar el tipo de agregación.

¡Gracias por sus comentarios!