Agregación de datos en Tableau
En Tableau puede agregar medidas o dimensiones, aunque es más habitual agregar medidas. Siempre que añada una medida a la vista, se aplica una agregación a dicha medida de forma predeterminada. El tipo de agregación que se aplica varía en función del contexto de la vista.
Cambiar la agregación de una medida en la vista
Al añadir una medida a la vista, Tableau agrega automáticamente sus valores. La suma, la media y la mediana son algunas de las agregaciones habituales. Para ver una lista completa, consulte Lista de agregaciones predefinidas en Tableau.
La agregación actual aparece como parte del nombre de la medida en la vista. Por ejemplo, Sales se convierte en SUM(Sales). Cada medida tiene una agregación predeterminada, establecida por Tableau cuando se conecta a una fuente de datos. Puede ver o cambiar la agregación predeterminada de una medida (consulte Establecer la agregación predeterminada para una medida).
Puede agregar medidas con Tableau solo para fuentes de datos relacionales. Las fuentes de datos multidimensionales contienen datos ya agregados. En Tableau, las fuentes de datos multidimensionales solo son compatibles con Windows.
Puede cambiar la agregación de una medida en la vista desde el menú contextual correspondiente:
Agregar dimensiones
Puede agregar una dimensión a la vista como Mínimo, Máximo, Conteo o Conteo (Definido). Al agregar una dimensión, se crea una nueva columna de medida temporal, de forma que la dimensión adopta las características de una medida.
Otra forma de ver una dimensión es tratarla como un Atributo eligiendo Atributo en el menú contextual de la dimensión. La agregación Atributo tiene distintos usos:
- Puede proporcionar un nivel de detalle coherente al combinar varias fuentes de datos.
- Puede servir para agregar dimensiones al efectuar cálculos de tablas, que necesitan una expresión de agregación.
- Puede mejorar el rendimiento de las consultas, dado que se calcula
Tableau calcula el atributo usando la siguiente fórmula:
IF MIN([dimension]) = MAX([dimension]) THEN
MIN([dimension]) ELSE "*" END
La fórmula se calcula en Tableau después de que los datos se recuperen de la consulta inicial. El asterisco (*) es en realidad un indicador visual de un tipo especial de valor nulo que ocurre cuando hay varios valores. Consulte Solucionar problemas de combinación de datos(El enlace se abre en una ventana nueva) para obtener más información sobre el asterisco.
A continuación se presenta un ejemplo del uso de Atributo en un cálculo de tablas. La tabla muestra las ventas por mercado, tamaño de mercado y estado. Supongamos que desea calcular el porcentaje de las ventas totales que cada estado supuso para el mercado. Al añadir un cálculo de tabla rápido de Porcentaje del Total (consulte Cálculos de tablas rápidos(El enlace se abre en una ventana nueva)) que calcula el Estado, el cálculo se realiza dentro de la zona roja. Esto se debe a que la dimensión Tamaño del mercado está particionando los datos.
Al agregar Tamaño de mercado como atributo, el cálculo se efectúa dentro de Mercado (Este, en la siguiente imagen) y Tamaño de mercado se utiliza simplemente como una etiqueta.
Lista de agregaciones predefinidas en Tableau
Algunas veces es útil mirar los datos numéricos en una forma agregada como una suma o un promedio. Las funciones matemáticas que producen datos agregados se llaman funciones de agregación. Las funciones de agregación realizan un cálculo en un conjunto de valores y resultan en un valor único. Por ejemplo, una medida que contiene los valores 1, 2, 3, 3, 4 agregados como una suma devuelve un valor único: 13. O si tiene 3000 transacciones de ventas de 50 productos, le conviene ver la suma de ventas por producto para determinar qué productos tienen los mayores ingresos.
Nota: En ocasiones, usar valores de punto flotante con agregaciones puede arrojar resultados inesperados. Para obtener más información, consulte Comprender los tipos de datos en los cálculos(El enlace se abre en una ventana nueva).
Tableau proporciona un conjunto de agregaciones predefinidas que se muestran en la tabla. Puede establecer la agregación predeterminada para cualquier medida que no sea un campo calculado que a su vez contenga una agregación, como AVG([Discount])
. Consulte Establecer la agregación predeterminada para una medida. También puede establecer la agregación para un campo que ya esté en la vista. Para obtener más información, consulte Cambiar la agregación de una medida en la vista.
Agregación | Descripción | Resultado para medida que contiene 1, 2, 2, 3 |
---|---|---|
Atributo | Devuelve el valor de la expresión dada si solo tiene un valor individual para todas las filas del grupo; de lo contrario muestra un asterisco (*). Se ignoran los valores nulos. Esta agregación es útil al agregar una dimensión. Para establecer una medida en la vista para esta agregación, haga clic con el botón derecho (Control clic en un Mac) en la medida y elija Atributo. El campo cambiará para mostrar el texto ATTR: | * |
Dimensión | Devuelve todos los valores únicos en una medida o dimensión. | 3 valores (1, 2, 3) |
Suma | Devuelve la suma de los números en una medida. Se ignoran los valores nulos. | 1 valor (8) |
Promedio | Devuelve la media aritmética de los números en una medida. Se ignoran los valores nulos. | 1 valor (2) |
Conteo (Definido) | Devuelve el número de valores únicos en una medida o dimensión. Cuando se aplica a una dimensión, Tableau crea una nueva columna temporal que es una medida, porque el resultado de un conteo es un número. Puede contar números, fechas, booleanos y cadenas. Los valores nulos se ignoran en todos los casos. Esta agregación no está disponible para los siguientes tipos de libros de trabajo:
Si está conectado a un libro de trabajo que utiliza uno de estos tipos, Conteo (Definido) no estará disponible y Tableau mostrará el mensaje "Requiere extracto". Extraiga sus datos para poder usar esta agregación. Consulte Extraer los datos. | 1 valor (3) |
Mínimo | Devuelve el número menor en una medida o dimensión continua. Se ignoran los valores nulos. | 1 valor (1) |
Máximo | Indica el número mayor de una medida o de la expresión dada sobre la base de una población de muestra. Se ignoran los valores nulos. Devuelve un nulo si hay menos de 2 miembros en la muestra que no sean nulos. Use esta función si sus datos representan una muestra de la población. | 1 valor (3) |
Est. Des (Pop.) | Devuelve la desviación estándar de todos los valores en la expresión dada sobre la base de una población parcial. Supone que sus argumentos constan de toda la población. Use esta función para tamaños de muestra grandes. | 1 valor (0,7071) |
Discordancia | Devuelve la discordancia de todos los valores en la expresión dada sobre la base de una muestra. Se ignoran los valores nulos. Devuelve un nulo si hay menos de 2 miembros en la muestra que no sean nulos. Use esta función si sus datos representan una muestra de la población. | 1 valor (0,6667) |
Discordancia (Pop.) | Devuelve la discordancia de todos los valores en la expresión dada sobre la base de una población de muestra parcial. Supone que sus argumentos constan de toda la población. Use esta función para tamaños de muestra grandes. | 1 valor (0,5000) |
Desasociar | Devuelve todos los registros en la fuente de datos subyacente. Para desasociar todas las medidas en la vista, seleccione Agregar medidas desde el menú Análisis (para borrar la marca de verificación). Tableau le permite ver datos en forma desasociada (solo bases de datos relacionales). Cuando los datos se desasocian, puede ver las filas individuales de su fuente de datos. Por ejemplo, después de descubrir que la suma de las ventas de bandas de goma es de 14.600 $, convendría ver la distribución de las transacciones de ventas individuales. Para responder esta pregunta, debe crear una vista que muestre filas de datos individuales. Es decir, debe desasociar los datos (consulte Cómo desasociar datos). Otra forma de ver los datos desasociados es ver los datos subyacentes para toda la vista o una parte de ella. Para obtener más información, consulte Ver datos subyacentes. | 4 valores (1, 2, 2, 3) |
También puede definir agregaciones personalizadas, como se describe en Funciones agregadas en Tableau(El enlace se abre en una ventana nueva). Según el tipo de vista de datos que cree, Tableau aplicará estas agregaciones al nivel de detalles adecuado. Por ejemplo, Tableau aplicará la agregación a miembros de dimensión individuales (el promedio de tiempo de entrega en la región oriental), a todos los miembros de una dimensión determinada (el promedio de tiempo de entrega en las regiones oriental, occidental y central) o a grupos de dimensiones (la suma de las ventas en todas las regiones y todos los mercados).
Establecer la agregación predeterminada para una medida
Puede establecer la agregación predeterminada para cualquier medida que no sea un campo calculado que a su vez contenga una agregación, como AVG([Discount])
. Una agregación predeterminada es un cálculo preferido para resumir un campo continuo o discreto. La agregación predeterminada se usa de manera automática cuando una medida se arrastra a una vista.
Para cambiar la agregación predeterminada:
Haga clic con el botón derecho (Ctrl+clic en un Mac) en una medida del panel Datos, seleccione Propiedades predeterminadas > Agregación y luego seleccione una de las opciones de agregación.
Nota: Puede agregar medidas con Tableau solo para fuentes de datos relacionales. Las fuentes de datos multidimensionales contienen solo datos agregados.
No se pueden definir agregaciones predeterminadas en fuentes de datos publicadas. La agregación predeterminada se define en el momento en que la fuente de datos se publica. Cree una copia local(El enlace se abre en una ventana nueva) de la fuente de datos publicada para ajustar la agregación predeterminada.
Cómo desasociar datos
Siempre que añada una medida a la vista, se aplica una agregación a dicha medida de forma predeterminada. Esta opción predeterminada se controla en Agregar medidas, en el menú Análisis.
Si decide que desea ver todas las marcas de la vista con el máximo nivel de granularidad, puede desasociar la vista. La desasociación de los datos implica que Tableau mostrará una marca aparte para cada valor de datos de cada una de las filas de la fuente de datos.
Para desasociar todas las medidas de la vista:
Borre la opción Análisis >Agregar medidas. Si ya está seleccionada, haga clic una vez en Agregar medidas para desactivarla.
Cuando Agregar medidas está seleccionado, Tableau intentará agregar medidas a la vista de forma predeterminada. Los valores de fila individuales de su fuente de datos se agregan en un valor único (una marca única) en el nivel de detalle de su vista.
Las distintas agregaciones disponibles para una medida determinan la forma en la que se recopilan los valores: se pueden sumar (SUM), se puede calcular la media (AVG) o se puede establecer su valor máximo (MAX) o mínimo (MIN) a partir de los valores de filas.
Puede consultar la lista completa de agregaciones disponibles en Lista de agregaciones predefinidas en Tableau.
El nivel de detalle está determinado por las dimensiones de la vista (para obtener información sobre el concepto de nivel de detalle, consulte Cómo afectan las dimensiones al nivel de detalle de la vista).
La desasociación de datos puede servir para analizar medidas que le conviene utilizar, tanto de forma independiente como dependiente en la vista. Por ejemplo, puede estar analizando los resultados de una encuesta de satisfacción de un producto con la edad de los participantes a lo largo de un eje. Puede, bien agregar el campo Edad para determinar el promedio de edad de los participantes, o bien desasociar los datos para determinar a qué edad los participantes se sintieron más satisfechos con el producto.
La desagregación de datos puede ser útil cuando se visualizan datos en forma de diagrama de dispersión. Consulte Ejemplo: diagramas de dispersión, agregación y granularidad.
Nota: Si la fuente de datos es muy grande, desagregarlos puede derivar en una degradación de rendimiento significativa.
Ejemplo: diagramas de dispersión, agregación y granularidad
Si coloca una medida en el estante Filas y otra medida en el estante Columnas, está pidiéndole a Tableau que compare dos valores numéricos. Normalmente, Tableau elige un diagrama de dispersión como visualización predeterminada en tales casos. La vista inicial tendrá, muy probablemente, una sola marca, que muestra la suma de todos los valores para las dos medidas. Esto significa que debe aumentar el nivel de detalle en la vista.
Empezar a crear el diagrama de dispersión
Usar dimensiones para añadir detalle
Pruebe a añadir más campos a los estantes de filas y columnas
Empezar a crear el diagrama de dispersión
Existen varias formas de desarrollar tal diagrama de dispersión: puede utilizar dimensiones para añadir detalles, puede añadir más campos los estantes Filas o Columnas o puede desasociar los datos. También puede usar cualquier combinación de estas opciones. Este tema explica estas alternativas usando la fuente de datos Sample - Superstore.
Para crear la vista inicial, siga estos pasos:
Coloque la medida Ventas en el estante Columnas.
Coloque la medida Ganancias en el estante Filas.
Las medidas se agregan automáticamente como sumas. La agregación predeterminada (SUM) se indica en los nombres de los campos. Los valores que se muestran en la descripción emergente muestran la suma de las ventas y los valores de las ganancias en todas las filas de la fuente de datos.
Siga estos pasos si quiere usar dimensiones para agregar detalle a la vista y desasociar datos.
Usar dimensiones para añadir detalle
Siga estos pasos para desarrollar la vista de diagrama de dispersión que creó agregando dimensiones para mostrar más niveles de detalle.
Arrastre la dimensión Categoría a Color, en la tarjeta Marcas.
Esto separa los datos en tres marcas, una para cada miembro de dimensión, y luego las codifica usando colores.
Arrastre la dimensión Estado a Detalle, en la tarjeta Marcas.
Ahora existen muchas más marcas en la vista. El número de marcas es idéntico al número de estados definidos en la fuente de datos multiplicado por la cantidad de categorías.
Aunque ahora se muestran más marcas, las medidas aún están agregadas. De modo que, haya una fila en la fuente de datos donde Estado = Dakota del Norte y Categoría = Muebles o haya 100 filas, el resultado siempre es una sola marca.
Tal vez este proceso esté desarrollando la visión en una dirección que le resulte útil, o tal vez prefiera ir en una dirección diferente. Usted decide qué preguntas desea plantear.
Pruebe a añadir más campos a los estantes de filas y columnas
Revierta a la vista de una marca original y siga estos pasos para desarrollar una vista de diagrama de dispersión agregando campos a los estantes Filas y Columnas.
Arrastre la dimensión Estado al estante Columnas.
Aunque suelte Continente a la derecha de SUM(Sales), Tableau lo mueve a la izquierda de SUM(Sales). Esto es porque no es posible insertar una dimensión dentro de un eje continuo. Por el contrario, su vista muestra un eje diferente para cada miembro de la dimensión.
Arrastre la dimensión Segmento al estante Filas.
Ahora tiene una vista que ofrece una descripción general de las Ventas y Ganancias en los segmentos de estados y clientes. Puede ser interesante situar el mouse sobre las marcas de la vista para ver datos de descripción emergente sobre varios segmentos:
Pruebe a desasociar los datos
Otra forma de modificar su diagrama de dispersión de una marca original para que muestre más marcas es desasociando los datos.
Borre la opción Análisis >Agregar medidas. Si ya está seleccionada, haga clic una vez en Agregar medidas para desactivarla.
Lo que hizo es desasociar los datos, ya que este comando es una alternancia que estaba seleccionada originalmente (marca de verificación presente). Tableau agrega los datos en su vista de forma predeterminada.
Ahora ve muchas marcas, una por cada fila de la fuente de datos original:
Cuando desasocia medidas, ya no está mirando al promedio o suma de los valores en las filas de la fuente de datos. En su lugar, la vista muestra una marca para cada fila en la fuente de datos. Desasociar datos es una forma de mirar al área de superficie completa de los datos. Es una forma rápida de comprender la forma de sus datos e identificar los valores anómalos. En este caso, la vista muestra que existe una relación constante entre las ventas y las ganancias, esto lo indica la línea de marcas alineadas a un ángulo de 45°.