Añadir líneas de tendencia a una visualización
Puede mostrar líneas de tendencia en una visualización para resaltar las tendencias de sus datos. Puede publicar una vista que contenga líneas de tendencia, del mismo modo que puede ir añadiendo líneas de tendencia a una vista mientras la edita en la web.
Cuando añade líneas de tendencia a la vista, puede especificar cómo desea que se vean y se comporten.
Añadir líneas de tendencia a una vista
Para añadir una línea de tendencia a una visualización:
Seleccione el panel Análisis.
Desde el panel Análisis, arrastre Línea de tendencia a la vista y, después, suéltela en los tipos de modelos Lineal, Logarítmica, Exponencial, Polinómica o Potencia.
Para obtener más información sobre cada uno de estos tipos de modelos, consulte Tipos de modelos de líneas de tendencia.
Acerca de la adición de líneas de tendencia (y cuándo no puede añadirlas)
Para agregar líneas de tendencia a una vista, ambos ejes deben contener un campo que se pueda interpretar como un número. Por ejemplo, no puede agregar una línea de tendencia a una vista que tenga la dimensión Categoría de producto, que contiene cadenas en el estante Columnas y la medida Ganancias en el estante Filas. No obstante, puede agregar una línea de tendencia a una vista de ventas en el tiempo debido a que tanto las ventas como el tiempo se pueden interpretar como valores numéricos.
Para fuentes de datos multidimensionales, las jerarquías de fecha en realidad contienen cadenas en lugar de números. Por lo tanto, las líneas de tendencia no están permitidas. Adicionalmente, los formatos de fecha ‘m/d/yy’ y ‘mmmm yyyy’ en todas las fuentes de datos no permiten líneas de tendencia.
Si tiene las líneas de tendencia activadas y modifica la vista de modo que las líneas de tendencia no estén permitidas, estas no se muestran. Estas líneas volverán a aparecer cuando cambie la vista de vuelta a un estado que admita líneas de tendencia.
Tableau apila automáticamente las marcas de barra en muchos casos. Sin embargo, las líneas de tendencia no se pueden activar para las barras apiladas. Puede desactivar las marcas apiladas desactivando la opción Análisis > Marcas apiladas.
Editar una línea de tendencia
Cuando añada una línea de tendencia a la visualización, podrá editarla para que se ajuste a su análisis.
Para editar una línea de tendencia:
En Tableau Desktop: haga clic con el botón derecho en una línea de tendencia de la visualización y seleccione Editar líneas de tendencia.
En el modo de edición web:
- En la visualización, haga clic en la línea de tendencia y, luego, sitúe el cursor sobre ella.
- En la descripción emergente que aparece, seleccione Editar para abrir el cuadro de diálogo Opciones de línea de tendencia.
Nota: Para editar una línea de tendencia en Tableau Cloud o Tableau Server, debe tener permisos de edición web.
Puede configurar las siguientes opciones en el cuadro de diálogo Opciones de línea de tendencia:
Seleccione un tipo de modelo. Para obtener más información, consulte Tipos de modelos de líneas de tendencia.
Seleccione los campos que desea usar como factores en el modelo de línea de tendencia. Para obtener más información, consulte Elegir qué campos usar como factores en el modelo de línea de tendencia.
- Decida si desea excluir el color, utilizando la opción Permitir una línea de tendencia por color. Si tiene codificaciones por color en la vista, puede usar esta opción para agregar una sola línea de tendencia que modele todos los datos, ignorando la codificación de color.
Decida si desea Mostrar bandas de confidencia. Las bandas de confidencia de Tableau muestran las líneas superior e inferior de 95 % de confianza, de forma predeterminada, al agregar líneas de tendencia. Las líneas de confidencia no son compatibles con modelos Exponenciales.
Seleccione si va a forzar la intercepción de y a cero. Esta opción es útil cuando sabe que quiere que su línea de tendencia comience por cero. Esta opción solo estará disponible cuando los estantes Filas y Columnas contengan un campo continuo como, por ejemplo, un gráfico de dispersión.
Decida si desea mostrar las líneas recalculadas cuando seleccione o resalte datos en la visualización.
Elegir qué campos usar como factores en el modelo de línea de tendencia
En el caso de los modelos de tendencias que tengan en cuenta varios campos, puede eliminar campos concretos como factores en el modelo de línea de tendencia.
Con frecuencia querrá quitar factores porque deseará que el modelo de línea de tendencia se base en la fila completa de la tabla en vez de que esté desglosada por los miembros o valores de un campo. Considere el siguiente ejemplo. La siguiente vista muestra las ventas mensuales de varias categorías de productos, desglosadas por región.
Puede ver que se crea un modelo aparte para cada región.
Ahora, quite Región como factor del modelo al cancelar la selección del mismo en el cuadro de diálogo Opciones de líneas de tendencia.
Puede ver que el modelo de línea de tendencia dentro de una categoría ahora es el mismo en todas las regiones. Esto le permite comparar las ventas reales frente a una línea de tendencia que es la misma para todas las regiones.
Quitar líneas de tendencia
Para quitar una línea de tendencia de una visualización, arrástrela fuera del área de visualización. También puede hacer clic en una línea de tendencia y elegir Quitar.
Para quitar todas las líneas de tendencia de la vista, seleccione Análisis >Líneas de tendencia >Mostrar líneas de tendencia.
Nota: En Tableau Desktop, las opciones de línea de tendencia se conservan, de modo que si vuelve a seleccionar Mostrar líneas de tendencia en el menú Análisis, las opciones seguirán configuradas como la última vez. Sin embargo, si cierra el libro de trabajo con las líneas de tendencia desactivadas, las opciones de línea de tendencia volverán a los valores predeterminados.
Ver una descripción de una línea de tendencia o un modelo de línea de tendencia
Después de añadir líneas de tendencia, puede mostrar estadísticas en la línea de tendencia. Por ejemplo, puede ver la fórmula y los valores R cuadrado y p. Para obtener más información sobre los tipos de modelos y los términos utilizados en las descripciones, consulte las secciones Términos del modelo de línea de tendencia y Tipos de modelos de líneas de tendencia.
Para ver una descripción de una línea de tendencia:
- Sitúese sobre cualquier parte de una línea de tendencia para ver su descripción.
Solo Tableau Desktop
- Haga clic con el botón derecho en la línea de tendencia en la visualización y, después, seleccione Describir línea de tendencia.
Para ver una descripción completa del modelo que se usa en la vista actual:
- Haga clic con el botón derecho en una línea de tendencia en la visualización y, después, seleccione Describir modelo de tendencia.
Tipos de modelos de líneas de tendencia
Estos son los tipos de modelos disponibles para las líneas de tendencia: Lineal, Logarítmico, Exponencial, Potencia y Polinomial.
En las siguientes fórmulas, la X representa la variable explicativa, mientras que la Y es la variable de respuesta.
Lineal
Con el tipo de modelo lineal, la fórmula es:
Y = b0 + b1 * X
donde b1
es la inclinación y b0
es la interceptación de la línea.
Logarítmico
Con el tipo de modelo logarítmico, la fórmula es:
Y = b0 + b1 * ln(X)
Ya que no se puede definir un logaritmo por un número menor a cero, cualquier marca para la cual la variable de respuesta sea negativa se filtra antes de la estimación de modelo. Evite usar un modelo que descarte algunos datos a menos que sepa que los datos filtrados no son válidos. La descripción de línea de tendencia informa cuantas marcas se filtraron antes de la estimación del modelo.
Exponencial
Con el tipo de modelo exponencial, la fórmula es:
Y = exp(b0)* exp(b1 * X)
Con un modelo exponencial, el registro natural transforma la variable de respuesta antes del cálculo del modelo, de modo que las marcas trazadas en su vista se encuentran introduciendo varios valores explicativos para encontrar valores de ln(Y)
.
ln(Y) = b0 + b1 * X
Estos valores se elevan exponencialmente para trazar la línea de tendencias. Lo que ve es el modelo exponencial en la siguiente forma:
Y = b2*exp(b1 * X)
Donde b2
es el valor de exp(b0)
. Ya que no se puede definir un logaritmo por un número menor a cero, cualquier marca para la cual la variable de respuesta sea negativa se filtra antes de la estimación de modelo.
Potencia
Con el tipo de modelo de potencia, la fórmula es:
Y = b0 * X^b1
Con un modelo de potencia, el registro natural transforma ambas variables antes del cálculo del modelo, lo cual da como resultado esta fórmula:
ln(Y) = ln(b0) + b1 * ln(X)
Estos valores se elevan exponencialmente para trazar la línea de tendencias.
Ya que no se puede definir un logaritmo por un número menor a cero, cualquier marca para la cual la variable de respuesta o la variable explicativa sea negativa se filtra antes de la estimación de modelo.
Polinomial
Con el tipo de modelo polinomial, la variable de respuesta se transforma en una serie polinomial del grado especificado. La fórmula es:
Y = b0 + b1 * X + b2 * X^2 + …
Con un tipo de modelo polinomial, también debe seleccionar un Grado entre 2 y 8. Los grados polinomiales mayores exageran las diferencias entre los valores de sus datos. Si sus datos aumentan de forma muy rápida, los términos de orden menor pueden no tener prácticamente variaciones en comparación con los términos de orden mayor, por lo que es imposible estimar el modelo de forma precisa. Además, los modelos polinomiales de mayor orden y más complicados requieren más datos para realizar una estimación. Compruebe si en la descripción de modelo de las líneas de tendencia individuales aparece un mensaje de advertencia rojo que indica que no es posible lograr un modelo preciso de este tipo.
Términos del modelo de línea de tendencia
Al ver la descripción para un modelo de línea de tendencia, hay varios valores que se enumeran. En esta sección se analiza qué significa cada uno de estos valores.
Fórmula de modelo
Esta es la fórmula de todo el modelo de línea de tendencia. La fórmula refleja si ha especificado excluir factores del modelo.
Número de observaciones modeladas
El número de filas usadas en la vista.
Número de observaciones filtradas
El número de observaciones excluidas del modelo.
Grados de libertad de modelo
El número de parámetros necesarios para especificar el modelo por completo. Las tendencias lineales, logarítmicas y exponenciales tienen grados de libertad de modelo de 2. Las tendencias polinómicas tienen grados de libertad de modelo de 1 más el grado del polinomio. Por ejemplo, una tendencia cúbica tiene grados de libertad de modelo de 4, debido a que necesitamos parámetros para los términos en cubo, cuadrado, lineales y constantes.
Grados de libertad residual (DF)
Para un modelo fijo, este valor se define como el número de observaciones menos el número de parámetros estimados en el modelo.
SSE (error de suma cuadrada)
Los errores son la diferencia entre el valor observado y el valor previsto por el modelo. En la tabla Análisis de discordancia, esta columna es en realidad la diferencia entre el SSE del modelo más sencillo en esa fila en particular y el modelo completo, el cual utiliza todos los factores. Este SSE corresponde también a la suma de las diferencias cuadradas de los valores previstos a partir del modelo más pequeño y el modelo completo.
MSE (error de media cuadrada)
El término MSE se refiere al "error de media cuadrada"que es la cantidad de SSE dividida por sus grados de libertad correspondientes.
R cuadrada
R cuadrada es una medida de cómo se ajustan los datos al modelo lineal. Es la relación entre la discordancia del error del modelo (o discordancia no explicada) y la discordancia total de los datos.
Cuando la intercepción de y está determinada por el modelo, R cuadrada se deriva con la siguiente ecuación:
En cambio, cuando la intercepción de y es igual a 0, R cuadrada se deriva con esta ecuación:
En el segundo caso, la ecuación no necesariamente coincidirá con Excel. Esto se debe a que R cuadrada no está bien definida en este caso y el comportamiento de Tableau es igual al de R y no al de Excel.
Nota: El valor R cuadrado de un modelo de línea de tendencia lineal es equivalente al cuadrado del resultado de la función CORR. Consulte Funciones de Tableau (alfabéticamente)(El enlace se abre en una ventana nueva) para consultar la sintaxis y ejemplos de CORR.
Error estándar
La raíz cuadrada del MSE del modelo completo. Una estimación de la desviación estándar (variabilidad) de los "errores aleatorios"en la fórmula del modelo.
Valor p (significancia)
La probabilidad de que una variable aleatoria F con los grados de libertad anteriores supere la F observada en esta fila de la tabla Análisis de discordancia.
Análisis de discordancia
Esta tabla, conocida también como la tabla ANOVA, enumera información de cada factor en el modelo de línea de tendencia. Los valores son una comparación del modelo sin el factor en cuestión para todo el modelo, el cual incluye todos los factores.
Líneas de tendencia individuales
Esta tabla proporciona información sobre cada línea de tendencia en la vista. Al observar la lista se pueden ver cuáles son las más importantes en términos estadísticos, de haber alguna. Esta tabla también muestra las estadísticas de coeficientes para cada línea de tendencia. Una fila describe cada coeficiente en cada modelo de línea de tendencia. Por ejemplo, un modelo lineal con una intercepción necesita dos filas para cada línea de tendencia. En la columna Línea, el valor p y los DF para cada línea abarcan todas las filas de coeficientes. La columna de DF abajo muestra los grados de libertad residuales disponibles durante la estimación de cada línea.
Términos
Nombre del término independiente.
Valor
El valor estimado del coeficiente para el término independiente.
StdErr
Una medida de la difusión de la distribución de muestras de la estimación de coeficiente. Este error se reduce a medida que aumenta la calidad y cantidad de la información utilizada en la estimación.
valor t
La estadística utilizada para probar la hipótesis nula de que el valor verdadero del coeficiente es cero.
Valor p
La probabilidad de observar un valor t así de grande o de mayor magnitud si el valor verdadero del coeficiente es cero. De modo que un valor p de 0,05 nos ofrece un 95% de confianza de que el valor verdadero no es cero.
Evaluar la importancia de las líneas de tendencia
Para ver información relevante sobre cualquier línea de tendencia de la vista, sitúe el cursor encima:
En la primera línea de la descripción emergente se muestra la ecuación que se usa para calcular un valor de Ganancias a partir de un valor de Año de fecha de pedido.
En la segunda línea (el valor R cuadrado) se muestra la relación de discordancia en los datos, tal como lo explica el modelo, con la discordancia total de los datos. Para obtener más detalles, consulte Términos del modelo de línea de tendencia.
En la tercera línea (el valor P) se informa de la probabilidad de que la ecuación de la primera línea fuera resultado de una circunstancia aleatoria. Mientras menor sea el valor p, más importante será el modelo. Un valor p de 0,05 o inferior se considera suficiente por lo general.
Importancia de todo el modelo
Después de agregar una línea de tendencia a la vista, por lo general, necesita saber la bondad del ajuste del modelo, que es una medida de calidad de las predicciones del modelo. Además, es posible que esté interesado en la importancia de cada factor que contribuye al modelo. Para ver estos números, abra el cuadro de diálogo Describir modelo de tendencia, haga clic con el botón derecho (Control + clic en Mac) en la vista y seleccione Líneas de tendencia > Describir modelo de tendencia.
Cuando esté comprobando la importancia, deberá fijarse en los valores p. Mientras menor sea el valor p, más importante será el modelo o el factor. Es posible tener un modelo que tenga importancia estadística pero que contenga una línea de tendencia individual o un término de línea de tendencia individual que no contribuya a la importancia global.
Debajo de Modelo de líneas de tendencia, busque la línea que muestra el valor p (importancia) del modelo: Mientras más pequeño sea el valor p, es menos probable que la diferencia en la discordancia no explicada entre modelos con y sin el campo sea un resultado de casualidad.
Este valor p para un modelo compara el ajuste de todo el modelo con el ajuste de un modelo compuesto exclusivamente de la media mayor (el promedio de datos en la vista de datos). Es decir, evalúa la potencia explicativa del término cuantitativo f(x) en la fórmula del modelo, que puede ser lineal, polinómica, exponencial o logarítmica con los factores fijados. Es común evaluar la importancia con la regla del "95% de confianza" . Así, según se indica anteriormente, un valor p de 0,05 o menos se considera bueno.
Importancia de factores categóricos
En la tabla Análisis de discordancia, algunas veces conocida como tabla ANOVA, se muestra cada campo utilizado como un factor en el modelo. Para cada campo, entre otros valores, podrá ver el valor p. En este caso, el valor p indica cuánto agrega ese campo a la importancia de todo el modelo. Mientras más pequeño sea el valor p, menos probable será que la diferencia en la discordancia no explicada entre modelos con y sin el campo sea el resultado de una casualidad. Los valores que se muestran para cada campo se derivan de comparar un nuevo modelo con un modelo que no incluye el campo en cuestión.
La siguiente imagen muestra la tabla Análisis de discordancia para obtener una vista de las ventas por trimestre de los últimos dos años de tres categorías de productos diferentes.
Como puede ver, los valores p para Categoríay Región son bastante pequeños. Estos dos factores son estadísticamente importantes en este modelo.
Para obtener información sobre términos de líneas de tendencia, consulte Términos del modelo de línea de tendencia.
Para los modelos ANOVA, las líneas de tendencia se definen mediante la fórmula matemática:
Y = factor 1 * factor 2 *
...factorN * f(x) + e
El término Y
se denomina variable de respuesta y corresponde al valor que está tratando de predecir. El término X
es la variable explicativa y e (epsilon) es el error aleatorio. Los factores de la expresión corresponden a los campos categóricos en la vista. Además, cada factor se representa como una matriz. El signo *
es un tipo de operador de multiplicación de matriz particular que considera dos matrices con el mismo número de filas y devuelve una matriz nueva con la misma cantidad de filas. Esto significa que en la expresión factor
1 * factor 2
, se introducen todas las combinaciones de los miembros de factor 1 y factor 2. Por ejemplo, si el factor 1 y el factor 2 tienen ambos tres miembros, entonces se presentará un total de nueve variables en la fórmula del modelo mediante este operador.
Suposiciones de líneas de tendencia
Los valores p informaron en Tableau que las líneas de tendencia dependen de algunas suposiciones sobre los datos.
La primera suposición es que cada vez que se realiza una prueba, el modelo para la media es, al menos aproximadamente, correcto.
La segunda suposición es que los "errores aleatorios" citados en la fórmula de modelo (consulte Tipos de modelos de líneas de tendencia) son independientes a través de diferentes observaciones y que todos tienen la misma distribución. Esta restricción se infringiría si la variable de la respuesta tuviera mucha más variabilidad con respecto a la línea de tendencia verdadera en una categoría que en otra.
Suposiciones requeridas para calcular líneas de tendencia
Las Suposiciones requeridas para calcular (utilizando Mínimos cuadrados ordinarios) cada línea de tendencia individual son:
Su modelo es una simplificación funcional precisa del proceso de generación de datos válidos (por ejemplo, el modelo no lineal para una relación lineal logarítmica).
Sus errores promedian cero y no están correlacionados con su variable independiente (por ejemplo, ningún error que mida la variable independiente).
Sus errores tienen una constante discordancia y no están correlacionados entre sí (por ejemplo, ningún aumento en los errores se distribuye a medida que su variable independiente aumenta).
Las variables explicativas no son funciones lineales exactas entre sí (multicolinealidad perfecta).
Preguntas frecuentes sobre líneas de tendencia
En esta sección se describen algunas de las preguntas más frecuentes respecto a las líneas de tendencia en Tableau.
¿Cómo cambió nivel de confianza usado en el modelo?
Tableau no impone un nivel de confianza. Simplemente informa la importancia de todo el modelo, o de un campo específico, mostrando el valor p. El valor p mide la probabilidad de obtener el mismo resultado de tendencia sin tener en cuenta las dimensiones. Por ejemplo, una tendencia de ventas por tiempo con valor p de 0,05 indica que hay un 5% de probabilidades de obtener el mismo valor tener en cuenta el tiempo.
¿Qué significa si el valor p del modelo es importante pero el valor p del campo específico en la tabla Análisis de discordancia no es importante?
El valor p en la tabla Análisis de discordancia indica si el campo agrega o le resta importancia a todo el modelo. Mientras más pequeño sea el valor p, menos probable será que la diferencia en la discordancia no explicada entre modelos con y sin el campo sea el resultado de una casualidad. Los valores que se muestran para cada campo se derivan de comparar un nuevo modelo con un modelo que no incluye el campo en cuestión. Por lo tanto, para la situación donde el valor para el modelo es importante pero el valor p para el campo específico no lo es, sabe que el modelo es estadísticamente significativo, pero no puede tener la confianza de que el campo específico en cuestión agrega algo al modelo. Considere si no sería mejor quitar el factor del modelo.
¿Qué significa si el valor p del campo específico en la tabla Análisis de discordancia es importante pero el valor p del modelo no lo es?
Esto puede suceder en un caso donde no hay ninguna "tendencia"dentro de cada panel. Por ejemplo, las líneas son planas, pero la media varía a través de un factor dado.