Funciones agregadas en Tableau

Se aplica a: Tableau Cloud, Tableau Desktop, Tableau Public, Tableau Server

En este artículo se presentan las funciones agregadas y sus usos en Tableau. También se muestra cómo crear un cálculo agregado mediante un ejemplo.

Por qué usar funciones agregadas

Las funciones agregadas le permiten resumir o cambiar la granularidad de los datos.

Por ejemplo, supongamos que desea saber exactamente cuántos pedidos tenía su almacén durante un año concreto. Puede usar la función COUNTD para resumir el número exacto de pedidos únicos que tenía su empresa y después desglosar la visualización por años.

El cálculo se podría parecer a lo siguiente:

COUNTD(Order ID)

La visualización se podría parecer a lo siguiente:

Funciones agregadas disponibles en Tableau

Agregaciones y aritmética de punto flotante: es posible que los resultados de algunas agregaciones no sean siempre exactamente como se esperan. Por ejemplo, puede encontrar que la función SUMA indica el valor -1.42e-14 para una columna de números que sabe que deberían dar como resultado exactamente 0. Esto ocurre porque el estándar 754 de punto flotante del Institute of Electrical and Electronics Engineers (IEEE) requiere que los números se almacenen en formato binario, lo que significa que a veces, los números se redondean a niveles de precisión extremadamente finos. Puede eliminar esta distracción potencial con la función ROUND (consulte Funciones numéricas) o formateando el número para mostrar menos lugares decimales.

ATTR

Sintaxis	`ATTR(expression)`
Definición	Indica el valor de la expresión si tiene un valor individual para todas las filas. De lo contrario, indica un asterisco. Se ignoran los valores nulos.

AVG

Sintaxis	`AVG(expression)`
Definición	Indica el promedio de todos los valores de la expresión. Se ignoran los valores nulos.
Notas	`AVG` solo puede utilizarse con campos numéricos.

COLLECT

Sintaxis	`COLLECT(spatial)`
Definición	Un cálculo agregado que combina los valores del campo del argumento. Se ignoran los valores nulos.
Notas	`COLLECT` solo puede utilizarse con campos espaciales.

CORR

Sintaxis	`CORR(expression1, expression2)`
Resultado	Número de -1 a 1
Definición	Indica el coeficiente de correlación de Pearson de dos expresiones.
Ejemplo	example
Notas	La correlación de Pearson mide la relación lineal entre dos variables. Los resultados oscilan entre -1 y +1 (ambos incluidos), donde 1 indica una relación lineal positiva exacta, 0 indica que no hay ninguna relación lineal entre la varianza y −1 es una relación negativa exacta. El cuadrado de un resultado de CORR es equivalente al valor R cuadrado de un modelo de línea de tendencia lineal. Consulte Términos del modelo de línea de tendencia(El enlace se abre en una ventana nueva). Utilizar con expresiones LOD con ámbito de tabla: Puede utilizar CORR para visualizar la correlación en una dispersión desagregada mediante una expresión de nivel de detalle con ámbito de tabla(El enlace se abre en una ventana nueva). Por ejemplo: {CORR(Sales, Profit)} Con una expresión de nivel de detalle, la correlación se aplica a todas las filas. Si ha utilizado una fórmula como `CORR(Sales, Profit)` (sin los paréntesis circundantes para convertirla en una expresión de nivel de detalle), la vista mostraría la correlación de cada punto del diagrama de dispersión con el resto de los puntos, que son indefinidos.
Limitaciones de la base de datos	`CORR` está disponible con las siguientes fuentes de datos: extracciones de datos de Tableau, Cloudera Hive, EXASolution, Firebird (versión 3.0 y posteriores), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata, Vertica. En cuanto a otras fuentes de datos, plantéese la posibilidad de extraer los datos o de utilizar `WINDOW_CORR`. Consulte Funciones de cálculo de tablas(El enlace se abre en una ventana nueva).

COUNT

Sintaxis	`COUNT(expression)`
Definición	Indica el número de elementos. No se cuentan los valores nulos.

COUNTD

Sintaxis	`COUNTD(expression)`
Definición	Indica el número de elementos definidos en un grupo. No se cuentan los valores nulos.

COVAR

Sintaxis	`COVAR(expression1, expression2)`
Definición	Indica la covarianza de muestra de dos expresiones.
Notas	La covarianza cuantifica cómo varían conjuntamente dos variables. Una covarianza positiva indica que las variables tienden a desplazarse hacia la misma dirección, como cuando los valores altos de una variable tienden a corresponderse con valores altos de la otra variable, como promedio. La covarianza de muestra utiliza el número de puntos de datos no nulos n - 1 para normalizar el cálculo de la covarianza, en vez de utilizar n, que se utiliza en la covarianza de población (disponible en la función `COVARP`). La covarianza de muestra es la opción adecuada si los datos representan una muestra aleatoria utilizada para estimar la covarianza de una población elevada. Si `<expression1>` y `<expression2>` son iguales (por ejemplo, `COVAR([profit], [profit])`), `COVAR` indica un valor que especifica el alcance de la distribución de los valores. El valor de `COVAR(X, X)` es equivalente al valor de `VAR(X)` y al valor de `STDEV(X)^2`.
Limitaciones de la base de datos	`COVAR` está disponible con las siguientes fuentes de datos: extracciones de datos de Tableau, Cloudera Hive, EXASolution, Firebird (versión 3.0 y posteriores), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata, Vertica. En cuanto a otras fuentes de datos, plantéese la posibilidad de extraer los datos o de utilizar `WINDOW_COVAR`. Consulte Funciones de cálculo de tablas(El enlace se abre en una ventana nueva).

COVARP

Sintaxis	`COVARP(expression 1, expression2)`
Definición	Indica la covarianza de población de dos expresiones.
Notas	La covarianza cuantifica cómo varían conjuntamente dos variables. Una covarianza positiva indica que las variables tienden a desplazarse hacia la misma dirección, como cuando los valores altos de una variable tienden a corresponderse con valores altos de la otra variable, como promedio. La covarianza de población es la covarianza de muestra multiplicada por (n-1)/n, donde n es el número total de puntos de datos no nulos. La covarianza de población es la opción adecuada si hay datos disponibles para todos los elementos de interés, a diferencia de cuando solo hay un subconjunto aleatorio de elementos, en cuyo caso se recomienda utilizar la covarianza de muestra (con la función `COVAR`). Si `<expression1>` y `<expression2>` son iguales (por ejemplo, `COVARP([profit], [profit])`), `COVARP` indica un valor que especifica el alcance de la distribución de los valores. Nota: El valor de `COVARP(X, X)` es equivalente al valor de `VARP(X)` y al valor de `STDEVP(X)^2`.
Limitaciones de la base de datos	`COVARP` está disponible con las siguientes fuentes de datos: extracciones de datos de Tableau, Cloudera Hive, EXASolution, Firebird (versión 3.0 y posteriores), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata, Vertica En cuanto a otras fuentes de datos, plantéese la posibilidad de extraer los datos o de utilizar `WINDOW_COVAR`. Consulte Funciones de cálculo de tablas(El enlace se abre en una ventana nueva).

MAX

Sintaxis	`MAX(expression)` o `MAX(expr1, expr2)`
Resultado	El mismo tipo de datos que el argumento, o `NULL` si alguna parte del argumento es nula.
Definición	Indica el máximo de dos argumentos, los cuales deben ser del mismo tipo de datos. `MAX` se puede aplicar también a un solo campo como una agregación.
Ejemplo	MAX(4,7) = 7 MAX(#3/25/1986#, #2/20/2021#) = #2/20/2021# MAX([Name]) = "Zander"
Notas	Para cadenas `MAX` suele ser el valor que aparece en último lugar en orden alfabético. Para las fuentes de datos de bases de datos, el valor de cadena `MAX` es el valor más alto en la secuencia de orden definido por la base de datos para esta columna. Para fechas Para las fechas, `MAX` es la fecha más reciente. Si `MAX` es una agregación, el resultado no tendrá una jerarquía de fechas. Si `MAX` es una comparación, el resultado conservará la jerarquía de fechas. Como agregación `MAX(expression)` es una función agregada y devuelve un solo resultado agregado. Se muestra como `AGG(expression)` en la visualización. Como comparación `MAX(expr1, expr2)` compara los dos valores y devuelve un valor de nivel de fila. Consulte también `MIN`.

MEDIAN

Sintaxis	`MEDIAN(expression)`
Definición	Indica la mediana de una expresión en todos los registros. Se ignoran los valores nulos.
Notas	`MEDIAN` solo puede utilizarse con campos numéricos.
Limitaciones de la base de datos	`MEDIAN` no está disponible para las siguientes fuentes de datos: Access, Amazon Redshift, Cloudera Hadoop, HP Vertica, IBM DB2, IBM PDA (Netezza), Microsoft SQL Server, MySQL, SAP HANA, Teradata. En el caso de otros tipos de fuentes de datos, los datos se pueden extraer en un archivo de extracción para usar esta función. Consulte Extraer los datos(El enlace se abre en una ventana nueva).

MIN

Sintaxis	`MIN(expression)` o `MIN(expr1, expr2)`
Resultado	El mismo tipo de datos que el argumento, o `NULL` si alguna parte del argumento es nula.
Definición	Indica el mínimo de dos argumentos, los cuales deben ser del mismo tipo de datos. `MIN` se puede aplicar también a un solo campo como una agregación.
Ejemplo	MIN(4,7) = 4 MIN(#3/25/1986#, #2/20/2021#) = #3/25/1986# MIN([Name]) = "Abebi"
Notas	Para cadenas `MIN` suele ser el valor que aparece en primer lugar en orden alfabético. Para las fuentes de datos de bases de datos, el valor de cadena `MIN` es el valor más bajo en la secuencia de orden definido por la base de datos para esta columna. Para fechas Para las fechas, `MIN` es la fecha más anterior. Si `MIN` es una agregación, el resultado no tendrá una jerarquía de fechas. Si `MIN` es una comparación, el resultado conservará la jerarquía de fechas. Como agregación `MIN(expression)` es una función agregada y devuelve un solo resultado agregado. Se muestra como `AGG(expression)` en la visualización. Como comparación `MIN(expr1, expr2)` compara los dos valores y devuelve un valor de nivel de fila. Consulte también `MAX`.

PERCENTILE

Sintaxis	`PERCENTILE(expression, number)`
Definición	Indica el valor de percentil de la expresión determinada correspondiente al `<number>` especificado. `<number>` debe oscilar entre 0 y 1 (incluido), así como ser una constante numérica.
Ejemplo	PERCENTILE([Score], 0.9)
Limitaciones de la base de datos	Esta función está disponible para las siguientes fuentes de datos: conexiones de archivos de texto y de Microsoft Excel no heredadas, tipos de fuentes de datos de extracción y de solo extracciones (por ejemplo, Google Analytics, OData o Salesforce), fuentes de datos de Sybase IQ 15.1 y posteriores, fuentes de datos de Oracle 10 y posteriores, fuentes de datos de Cloudera Hive y Hortonworks Hadoop Hive, fuentes de datos de EXASolution 4.2 y posteriores. En el caso de otros tipos de fuentes de datos, los datos se pueden extraer en un archivo de extracción para usar esta función. Consulte Extraer los datos(El enlace se abre en una ventana nueva).

STDEV

Sintaxis	`STDEV(expression)`
Definición	Indica la desviación estándar estadística de todos los valores en la expresión dada basado en una muestra de la población.

STDEVP

Sintaxis	`STDEVP(expression)`
Definición	Indica la desviación estándar estadística de todos los valores en la expresión dada en base a una población parcial.

SUM

Sintaxis	`SUM(expression)`
Definición	Indica la suma de todos los valores de la expresión. Se ignoran los valores nulos.
Notas	`SUM` solo puede utilizarse con campos numéricos.

VAR

Sintaxis	`VAR(expression)`
Definición	Indica la discordancia estadística de todos los valores en la expresión dada basado en una muestra de la población.

VARP

Sintaxis	`VARP(expression)`
Definición	Indica la discordancia estadística de todos los valores en la expresión dada de toda la población.

Crear un cálculo agregado

Siga los pasos que se indican a continuación para aprender a crear un cálculo agregado.

En Tableau Desktop, conéctese a la fuente de datos guardada Muestra - Supertienda, que se incluye con Tableau.
Vaya a una hoja de trabajo y seleccione Análisis > Crear campo calculado.
En el editor de cálculo que se abre, haga lo siguiente:
- Asigne el nombre Margen al campo calculado.
- Escriba la fórmula siguiente:
  IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)
  Nota: Puede usar la referencia de función para encontrar y añadir funciones agregadas y otras funciones (como la función IIF de este ejemplo) a la fórmula de cálculo. Para obtener más información, consulte Usar la referencia de funciones en el editor de cálculo.
- Cuando haya terminado, haga clic en Aceptar.
El nuevo cálculo agregado aparece en Medidas del panel Datos. Igual que con el resto de los campos, puede usarlo en una o más visualizaciones.
Nota: Los cálculos de agregación son siempre medidas.
Cuando Margen se coloca en un estante o en una tarjeta de una hoja de trabajo, su nombre se cambia a AGG(Margen), lo cual indica que se trata de un cálculo agregado y ya no puede agregarse más.

Reglas para cálculos agregados

Las reglas que aplican a los cálculos agregados son las siguientes:

En el caso de cualquier cálculo de agregación, no puede combinar un valor agregado con un valor desasociado. Por ejemplo, SUM(Price)*[Items] no es una expresión válida porque SUM(Price) está agregado y Items no. Sin embargo, SUM(Price*Items) SUM(Price)*SUM(Items) son válidas.
Los términos constantes en una expresión actúan como valores agregados o desasociados, según corresponda. Por ejemplo: Tanto SUM(Price*7) como SUM(Price)*7 son expresiones válidas.
Todas las funciones se pueden evaluar según valores agregados. Sin embargo, los argumentos ante cualquier función dada deber ser o todos agregados o todos desasociados. Por ejemplo, MAX(SUM(Sales),Profit) no es una expresión válida porque Ventas es un dato agregado y Beneficios no. Sin embargo, MAX(SUM(Sales),SUM(Profit)) es una expresión válida.
El resultado de un cálculo de agregación siempre es una medida. Esto incluye expresiones como ATTR(Dimensión) o MIN(Dimensión).
Igual que agregaciones predefinidas, los cálculos de agregación se calcular correctamente para totales generales. Consulte Totales generales para obtener más información.