Funciones agregadas en Tableau

En este artículo se presentan las funciones agregadas y sus usos en Tableau. También se muestra cómo crear un cálculo agregado mediante un ejemplo.

Por qué usar funciones agregadas

Las funciones agregadas le permiten resumir o cambiar la granularidad de los datos.

Por ejemplo, supongamos que desea saber exactamente cuántos pedidos tenía su almacén durante un año concreto. Puede usar la función COUNTD para resumir el número exacto de pedidos que tenía su empresa y después desglosar la visualización por años.

El cálculo se podría parecer a lo siguiente:

COUNTD(Order ID)

La visualización se podría parecer a lo siguiente:

Funciones agregadas disponibles en Tableau

Agregaciones y aritmética de punto flotante: es posible que los resultados de algunas agregaciones no sean siempre exactamente como se esperan. Por ejemplo, puede encontrar que la función Suma indica el valor -1.42e-14 para una columna de números que sabe debieran dar como resultado exactamente 0. Esto ocurre porque el estándar 754 de punto flotante del Institute of Electrical and Electronics Engineers (IEEE) requiere que los números se almacenen en formato binario, lo que significa que a veces, los números se redondean a niveles de precisión extremadamente finos. Puede eliminar esta distracción potencial con la función ROUND (consulte Funciones numéricas) o formateando el número para mostrar menos lugares decimales.

Función

Sintaxis

Definición

ATTR

ATTR(expression)

Indica el valor de la expresión si tiene un valor individual para todas las filas. De lo contrario, indica un asterisco. Se ignoran los valores nulos.

AVG

AVG(expression)

Indica el promedio de todos los valores de la expresión. AVG se puede usar solo con campos numéricos. Se ignoran los valores nulos.

COLLECT

COLLECT (spatial)

Un cálculo agregado que combina los valores del campo del argumento. Se ignoran los valores nulos.

Nota: la función COLLECT solo se puede usar con campos espaciales.

Ejemplo:

COLLECT ([Geometry])

CORR

CORR(expression 1, expression2)

Indica el coeficiente de correlación de Pearson de dos expresiones.

La correlación de Pearson mide la relación lineal entre dos variables. Los resultados oscilan entre -1 y +1 (ambos incluidos), donde 1 indica una relación lineal positiva exacta, como cuando un cambio positivo en una variable implica un cambio positivo de la magnitud correspondiente en el otro; 0 indica que no hay ninguna relación lineal entre la varianza y −1 es una relación negativa exacta.

CORR está disponible con las siguientes fuentes de datos:

  • Extracciones de datos de Tableau (puede crear una extracción desde cualquier fuente de datos)
  • Cloudera Hive
  • EXASolution
  • Firebird (versión 3.0 y posteriores)
  • Google BigQuery
  • Hortonworks Hadoop Hive
  • IBM PDA (Netezza)
  • Oracle
  • PostgreSQL
  • Presto
  • SybaseIQ
  • Teradata
  • Vertica

En cuanto a otras fuentes de datos, plantéese la posibilidad de extraer los datos o de utilizar WINDOW_CORR. Consulte Funciones de cálculo de tablas.

Nota: el cuadrado de un resultado de CORR es equivalente al valor R cuadrado de un modelo de línea de tendencia lineal. Consulte Términos del modelo de línea de tendencia.

Ejemplo:

Puede utilizar CORR para visualizar la correlación en un diagrama de dispersión desagregado. Para ello, debe utilizar una expresión de nivel de detalle con ámbito de tabla. Por ejemplo:

{CORR(Sales, Profit)}

Con una expresión de nivel de detalle, la correlación se aplica a todas las filas. Si ha utilizado una fórmula como CORR(Sales, Profit) (sin los paréntesis circundantes para convertirla en una expresión de nivel de detalle), la vista mostraría la correlación de cada punto del diagrama de dispersión con el resto de los puntos, que son indefinidos.

Consulte Ámbito de tabla.

COUNT

COUNT(expression)

Indica el número de elementos en un grupo. No se cuentan los valores nulos.

COUNTD

COUNTD(expression)

Indica el número de elementos definidos en un grupo. No se cuentan los valores nulos. Esta función no estará disponible en los casos siguientes: libros de trabajo creados antes de la versión Tableau Desktop 8.2 que usen Microsoft Excel o fuentes de datos de archivos de texto, libros de trabajo que usen la conexión heredada y libros de trabajo que usen fuentes de datos de Microsoft Access. Extraiga los datos a un archivo de extracción para usar esta funcionalidad. Consulte Extraer los datos.

COVAR

COVAR(expression 1, expression2)

Indica la covarianza de muestra de dos expresiones.

La covarianza cuantifica cómo varían conjuntamente dos variables. Una covarianza positiva indica que las variables tienden a desplazarse hacia la misma dirección, como cuando los valores altos de una variable tienden a corresponderse con valores altos de la otra variable, como promedio. La covarianza de muestra utiliza el número de puntos de datos no nulos n - 1 para normalizar el cálculo de la covarianza, en vez de utilizar n, que se utiliza en la covarianza de población (disponible en la función COVARP). La covarianza de muestra es la opción adecuada si los datos representan una muestra aleatoria utilizada para estimar la covarianza de una población elevada.

COVAR está disponible con las siguientes fuentes de datos:

  • Extracciones de datos de Tableau (puede crear una extracción desde cualquier fuente de datos)
  • Cloudera Hive
  • EXASolution
  • Firebird (versión 3.0 y posteriores)
  • Google BigQuery
  • Hortonworks Hadoop Hive
  • IBM PDA (Netezza)
  • Oracle
  • PostgreSQL
  • Presto
  • SybaseIQ
  • Teradata
  • Vertica

En cuanto a otras fuentes de datos, plantéese la posibilidad de extraer los datos o de utilizar WINDOW_COVAR. Consulte Funciones de cálculo de tablas.

Si expression1 y expression2 son iguales (por ejemplo, COVAR([profit], [profit])), COVAR indica un valor que especifica el alcance de la distribución de los valores.

Nota: el valor de COVAR(X, X) es equivalente al valor de VAR(X) y al valor de STDEV(X)^2.

Ejemplo:

La siguiente fórmula indica la covarianza de muestra de Ventas y Ganancias.

COVAR([Sales], [Profit])

COVARP

COVARP(expression 1, expression2)

Indica la covarianza de población de dos expresiones.

La covarianza cuantifica cómo varían conjuntamente dos variables. Una covarianza positiva indica que las variables tienden a desplazarse hacia la misma dirección, como cuando los valores altos de una variable tienden a corresponderse con valores altos de la otra variable, como promedio. La covarianza de población es la covarianza de muestra multiplicada por (n-1)/n, donde n es el número total de puntos de datos no nulos. La covarianza de población es la opción adecuada si hay datos disponibles para todos los elementos de interés, a diferencia de cuando solo hay un subconjunto aleatorio de elementos, en cuyo caso se recomienda utilizar la covarianza de muestra (con la función COVAR).

COVARP está disponible con las siguientes fuentes de datos:

  • Extracciones de datos de Tableau (puede crear una extracción desde cualquier fuente de datos)
  • Cloudera Hive
  • EXASolution
  • Firebird (versión 3.0 y posteriores)
  • Google BigQuery
  • Hortonworks Hadoop Hive
  • IBM PDA (Netezza)
  • Oracle
  • PostgreSQL
  • Presto
  • SybaseIQ
  • Teradata
  • Vertica

En cuanto a otras fuentes de datos, plantéese la posibilidad de extraer los datos o de utilizar WINDOW_COVARP. Consulte Funciones de cálculo de tablas.

Si expression1 y expression2 son iguales (por ejemplo, COVARP([profit], [profit])), COVARP indica un valor que especifica el alcance de la distribución de los valores.

Nota: el valor de COVARP(X, X) es equivalente al valor de VARP(X) y al valor de STDEVP(X)^2.

Ejemplo:

La siguiente fórmula indica la covarianza de población de Ventas y Ganancias.

COVARP([Sales], [Profit])

MAX

MAX(expression)

Indica el máximo de una expresión en todos los registros. Si la expresión es un valor de cadena, esta función indica el último valor donde se definió el último por orden alfabético.

MEDIAN

MEDIAN(expression)

Indica la mediana de una expresión en todos los registros. La mediana solo puede utilizarse con campos numéricos. Se ignoran los valores nulos. Esta función no está disponible para los libros de trabajo creados antes de Tableau Desktop 8.2 o para los que utilizan conexiones heredadas. Tampoco está disponible para las conexiones que utilizan cualquiera de las siguientes fuentes de datos:

  • Access
  • Amazon Redshift
  • Cloudera Hadoop
  • HP Vertica
  • IBM DB2
  • IBM PDA (Netezza)
  • Microsoft SQL Server
  • MySQL
  • SAP HANA
  • Teradata

En el caso de otros tipos de fuentes de datos, los datos se pueden extraer en un archivo de extracción para usar esta función. Consulte Extraer los datos.

MIN

MIN(expression)

Indica el mínimo de una expresión en todos los registros. Si la expresión es un valor de cadena, esta función indica el primer valor donde se definió el primero por orden alfabético.

PERCENTILE

PERCENTILE(expression, number)

Indica el valor de percentil de la expresión determinada correspondiente al número especificado. El número debe oscilar entre 0 y 1 (incluido), por ejemplo, 0,66, así como ser una constante numérica.

Esta función está disponible para las siguientes fuentes de datos:

  • Conexiones de archivos de texto y de Microsoft Excel no heredadas.

  • Tipos de fuentes de datos de extracción y de solo extracciones (por ejemplo, Google Analytics, OData o Salesforce).

  • Fuentes de datos Sybase IQ 15.1 y posteriores.

  • Fuentes de datos de Oracle 10 y versiones posteriores.

  • Fuentes de datos de Cloudera Hive y Hortonworks Hadoop Hive.

  • Fuentes de datos de EXASolution 4.2 y versiones posteriores.

En el caso de otros tipos de fuentes de datos, los datos se pueden extraer en un archivo de extracción para usar esta función. Consulte Extraer los datos.

STDEV

STDEV(expression)

Indica la desviación estándar estadística de todos los valores en la expresión dada basado en una muestra de la población.

STDEVP

STDEVP(expression)

Indica la desviación estándar estadística de todos los valores en la expresión dada en base a una población parcial.

SUM

SUM(expression)

Indica la suma de todos los valores de la expresión. SUM se puede usar solo con campos numéricos. Se ignoran los valores nulos.

VAR

VAR(expression)

Indica la discordancia estadística de todos los valores en la expresión dada basado en una muestra de la población.

VARP

VARP(expression)

Indica la discordancia estadística de todos los valores en la expresión dada de toda la población.


Crear un cálculo agregado

Siga los pasos que se indican a continuación para aprender a crear un cálculo agregado.

  1. En Tableau Desktop, conéctese a la fuente de datos guardada Sample - Superstore, que se incluye con Tableau.

  2. Vaya a una hoja de trabajo y seleccione Análisis > Crear campo calculado.

  3. En el editor de cálculo que se abre, haga lo siguiente:

    • Asigne el nombre Margen al campo calculado.

    • Escriba la fórmula siguiente:

      IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)

      Nota: puede usar la referencia de función para encontrar y añadir funciones agregadas y otras funciones (como la función IIF de este ejemplo) a la fórmula de cálculo. Para obtener más información, consulte Usar la referencia de funciones en el editor de cálculo.

    • Cuando haya terminado, haga clic en Aceptar.

    El nuevo cálculo agregado aparece en Medidas del panel Datos. Igual que con el resto de los campos, puede usarlo en una o más visualizaciones.

    Nota: los cálculos de agregación son siempre medidas.

    Cuando Margen se coloca en un estante o en una tarjeta de una hoja de trabajo, su nombre se cambia a AGG(Margen), lo cual indica que se trata de un cálculo agregado y ya no puede agregarse más.

    A graphic depicting what happens when you place an aggregate calculation on a shelf. The field displays the AGG prefix.

Reglas para cálculos agregados

Las reglas que aplican a los cálculos agregados son las siguientes:

  • En el caso de cualquier cálculo de agregación, no puede combinar un valor agregado con un valor desasociado. Por ejemplo, SUM(Price)*[Items] no es una expresión válida porque SUM(Price) está agregado y Items no. Sin embargo, tanto SUM(Price*Items) como SUM(Price)*SUM(Items) son válidas.

  • Los términos constantes en una expresión actúan como valores agregados o desasociados, según corresponda. Por ejemplo, tanto SUM(Price*7) como SUM(Price)*7 son expresiones válidas.

  • Todas las funciones se pueden evaluar según valores agregados. Sin embargo, los argumentos ante cualquier función dada deber ser o todos agregados o todos desasociados. Por ejemplo, MAX(SUM(Sales),Profit) no es una expresión válida porque Sales está agregado y Profit no. No obstante, MAX(SUM(Sales),SUM(Profit)) sí es una expresión válida.

  • El resultado de un cálculo de agregación siempre es una medida.

  • Igual que agregaciones predefinidas, los cálculos de agregación se calcular correctamente para totales generales. Consulte Totales generales para obtener más información.

Consulte también

Comprender los cálculos: cálculos agregados

Agregación de datos en Tableau

Funciones en Tableau

Funciones de Tableau (por categorías)

Funciones de Tableau (alfabéticamente)

¡Gracias por sus comentarios! Se produjo un error al enviar sus comentarios. Vuelva a intentarlo o escríbanos.