Funções de agregação no Tableau

Este artigo apresenta as funções de agregação e os respectivos usos no Tableau. Ela também demonstra como criar um cálculo agregado com um exemplo.

Por que usar funções de agregação

As funções de agregação permitem que você resuma ou altere a granularidade dos seus dados.

Por exemplo, você pode desejar saber quantos pedidos a sua loja recebeu em um ano específico. Para isso, use a função COUNTD para resumir o número exato de pedidos que a sua empresa recebeu e, em seguida, especificar a visualização por ano.

O cálculo pode ficar mais ou menos assim:

COUNTD(Order ID)

A visualização pode ficar mais ou menos assim:

Funções de agregação disponíveis no Tableau

Agregações e aritmética de ponto flutuante: os resultados de algumas agregações nem sempre podem ser exatamente como desejado. Por exemplo, você pode descobrir que a função Sum retorna um valor como -1.42e-14 para uma coluna de número que você sabe que devem somar exatamente 0. Isso acontece porque o padrão de ponto flutuante 754 do IEEE (Institute of Electrical and Electronics Engineers) exige que os números sejam armazenados em formato binário, o que significa que são, às vezes, arredondados em níveis extremamente sutis de precisão. Você pode eliminar essa possível distração usando a função ROUND (ver Funções de número) ou formatando o número para mostrar menos casas decimais.

Função

Sintaxe

Definição

ATTR

ATTR(expression)

Retorna o valor da expressão caso tenha um único valor para todas as linhas. Do contrário, retorna um asterisco. Os valores nulos são ignorados.

AVG

AVG(expression)

Retorna a média de todos os valores na expressão. AVG pode ser usada com campos numéricos apenas. Os valores nulos são ignorados.

COLLECT

COLLECT (spatial)

Um cálculo agregado que combina os valores no campo do argumento. Os valores nulos são ignorados.

Observação: a função COLLECT pode ser usada apenas com campos espaciais.

Exemplo:

COLLECT ([Geometry])

CORR

CORR(expression 1, expression2)

Retorna o coeficiente de correlação Pearson de duas expressões.

A correlação Pearson mede a relação linear entre duas variáveis. Os resultados variam de -1 a +1 inclusive, em que 1 denota uma relação linear positiva e exata, quando uma alteração positiva em uma variável implica na alteração positiva da magnitude correspondente da outra variável, 0 denota nenhuma relação linear entre a variância e −1 é uma relação negativa exata.

CORR está disponível com as seguintes fontes de dados:

  • Extrações de dados do Tableau (crie uma extração a partir de qualquer fonte de dados)
  • Cloudera Hive
  • EXASolution
  • Firebird (versão 3.0 e posterior)
  • Google BigQuery
  • Hortonworks Hadoop Hive
  • IBM PDA (Netezza)
  • Oracle
  • PostgreSQL
  • Presto
  • SybaseIQ
  • Teradata
  • Vertica

Para outras fontes de dados, considere extrair os dados ou usar WINDOW_CORR. Consulte Funções de cálculo de tabela.

Observação: o quadrado de um resultado CORR é equivalente ao valor quadrado de R para um modelo de linha de tendência linear. Consulte Termos do modelo de linha de tendência.

Exemplo:

Use CORR para visualizar a correlação em um gráfico de dispersão desagregado. A maneira para fazer isso é usar uma expressão de nível de detalhe com escopo de tabela. Por exemplo:

{CORR(Sales, Profit)}

Com uma expressão de nível de detalhe, a correlação é executada em todas as linhas. Se usou uma fórmula como CORR(Sales, Profit) (sem estar entre colchetes, para torná-la uma expressão de nível de detalhe), a exibição mostraria a correlação de cada ponto individual no gráfico de dispersão em relação ao outro ponto, que está indefinido.

Consulte Escopo de tabela

COUNT

COUNT(expression)

Retorna o número de itens em um grupo. Os valores Null não são contados.

COUNTD

COUNTD(expression)

Retorna o número de itens distintos em um grupo. Os valores Null não são contados. Essa função não está disponível nos seguintes casos: pastas de trabalho criadas antes do Tableau Desktop 8.2 que usam fontes de dados do Microsoft Excel ou de arquivo de texto, pastas de trabalho que usam a conexão herdada e pastas de trabalho que usam fontes de dados do Microsoft Access. Extraia seus dados para um arquivo de extração para usar essa função. Consulte Extrair seus dados.

COVAR

COVAR(expression 1, expression2)

Retorna a covariância de amostra de duas expressões

A covariância quantifica como duas variáveis mudam ao mesmo tempo. Uma covariância positiva indica que as variáveis tendem a se mover na mesma direção, como quando valores maiores de uma variável tendem a corresponder aos valores maiores da outra variável, em média. A covariância de amostra usa o número de pontos de dados não nulos, n - 1, para normalizar o cálculo da covariância, em vez de n, que é usado pela covariância populacional (disponível com a função COVARP). A covariância de amostra é a escolha apropriada quando os dados são uma amostra aleatória sendo usada para estimar a covariância de uma população maior.

COVAR está disponível com as seguintes fontes de dados:

  • Extrações de dados do Tableau (crie uma extração a partir de qualquer fonte de dados)
  • Cloudera Hive
  • EXASolution
  • Firebird (versão 3.0 e posterior)
  • Google BigQuery
  • Hortonworks Hadoop Hive
  • IBM PDA (Netezza)
  • Oracle
  • PostgreSQL
  • Presto
  • SybaseIQ
  • Teradata
  • Vertica

Para outras fontes de dados, considere extrair os dados ou usar WINDOW_COVAR. Consulte Funções de cálculo de tabela.

Se expression1 e expression2 forem iguais — por exemplo, COVAR([profit], [profit]) — COVAR retorna um valor que indica como os valores são distribuídos amplamente.

Observação: o valor de COVAR(X, X) é equivalente ao valor de VAR(X) e também ao valor de STDEV(X)^2.

Exemplo:

A fórmula a seguir retorna a covariância de amostra de Sales e Profit.

COVAR([Sales], [Profit])

COVARP

COVARP(expression 1, expression2)

Retorna a covariância populacional de duas expressões

A covariância quantifica como duas variáveis mudam ao mesmo tempo. Uma covariância positiva indica que as variáveis tendem a se mover na mesma direção, como quando valores maiores de uma variável tendem a corresponder aos valores maiores da outra variável, em média. A covariância populacional é a covariância de amostra multiplicada por (n-1)/n, em que n é o número total de pontos de dados não nulos. A covariância populacional é a escolha apropriada quando há dados disponíveis para todos os itens de interesse, ao invés de somente um subconjunto aleatório de itens, em que a covariância de amostra (com a função COVAR) é apropriada.

COVARP está disponível com as seguintes fontes de dados:

  • Extrações de dados do Tableau (crie uma extração a partir de qualquer fonte de dados)
  • Cloudera Hive
  • EXASolution
  • Firebird (versão 3.0 e posterior)
  • Google BigQuery
  • Hortonworks Hadoop Hive
  • IBM PDA (Netezza)
  • Oracle
  • PostgreSQL
  • Presto
  • SybaseIQ
  • Teradata
  • Vertica

Para outras fontes de dados, considere extrair os dados ou usar WINDOW_COVARP. Consulte Funções de cálculo de tabela.

Se expression1 e expression2 forem iguais — por exemplo, COVARP([profit], [profit]) — COVARP retorna um valor que indica como os valores são distribuídos amplamente.

Observação: o valor de COVARP(X, X) é equivalente ao valor de VARP(X) e também ao valor de STDEVP(X)^2.

Exemplo:

A fórmula a seguir retorna a covariância populacional de Sales e Profit.

COVARP([Sales], [Profit])

MAX

MAX(expression)

Retorna o máximo de uma expressão em todos os registros. Se a expressão for um valor de cadeia de caracteres, essa função retornará o último valor que foi definido em ordem alfabética.

MEDIAN

MEDIAN(expression)

Retorna o mediano de uma expressão em todos os registros. O mediano pode ser usado apenas com campos numéricos. Os valores nulos são ignorados. Essa função não está disponível para pastas de trabalho criadas antes do Tableau Desktop 8.2 e que usam conexões herdadas. Ela também não está disponível para conexões usando qualquer uma das fontes de dados a seguir:

  • Access
  • Amazon Redshift
  • Cloudera Hadoop
  • HP Vertica
  • IBM DB2
  • IBM PDA (Netezza)
  • Microsoft SQL Server
  • MySQL
  • SAP HANA
  • Teradata

Para outros tipos de fonte de dados, é possível extrair os dados para um arquivo de extração para usar essa função. Consulte Extrair seus dados.

MIN

MIN(expression)

Retorna o mínimo de uma expressão em todos os registros. Se a expressão for um valor de cadeia de caracteres, essa função retornará o primeiro valor que foi definido em ordem alfabética.

PERCENTILE

PERCENTILE(expression, number)

Retorna o valor percentil da expressão indicada correspondente ao número especificado. O número deve estar entre 0 e 1 (inclusive); por exemplo, 0,66, e deve ser uma constante numérica.

Essa função está disponível para as fontes de dados a seguir.

  • Conexões do Microsoft Excel e de arquivo de texto não herdadas.

  • Extrações e tipos de fonte de dados somente de extração (por exemplo, Google Analytics, OData ou Salesforce).

  • Fontes de dados do Sybase IQ 15.1 e posterior.

  • Fontes de dados do Oracle 10 e versões posteriores.

  • Fontes de dados do Cloudera Hive e Hortonworks Hadoop Hive.

  • Fontes de dados do EXASolution 4.2 e versões posteriores.

Para outros tipos de fonte de dados, é possível extrair os dados para um arquivo de extração para usar essa função. Consulte Extrair seus dados.

STDEV

STDEV(expression)

Retorna o desvio padrão estatístico de todos os valores na expressão atribuída com base em uma amostra da população.

STDEVP

STDEVP(expression)

Retorna o desvio padrão estatístico de todos os valores na expressão atribuída com base em uma tendência de população.

SUM

SUM(expression)

Retorna a soma de todos os valores na expressão. SUM pode ser usada com campos numéricos apenas. Os valores nulos são ignorados.

VAR

VAR(expression)

Retorna a variação estatística de todos os valores na expressão atribuída com base em uma amostra da população.

VARP

VARP(expression)

Retorna a variação estatística de todos os valores na expressão atribuída com base na população inteira.


Criar um cálculo agregado

Siga as etapas abaixo para saber como criar um cálculo agregado.

  1. No Tableau Desktop, conecte-se à fonte de dados salva Sample - Superstore, incluída no Tableau.

  2. Navegue até a pasta de trabalho e selecione Análise > Criar campo calculado.

  3. No editor de cálculo aberto, faça o seguinte:

    • Nomeie o campo calculado de Margem.

    • Insira a fórmula a seguir:

      IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)

      Observação: é possível usar a referência da função para encontrar e adicionar as funções de agregação e outras funções (como a função lógica IIF neste exemplo) à fórmula de cálculo. Para obter mais informações, consulte Usar a referência de funções no editor de cálculo.

    • Ao terminar, clique em OK.

    O novo cálculo agregado aparece em Medidas no painel Dados. Assim como os outros campos, é possível usá-lo em uma ou mais visualizações.

    Observação: os cálculos agregados são sempre medidas.

    Quando a Margem é colocada em uma divisória ou cartão na planilha, seu nome é alterado para AGG(Margem), indicando que é um cálculo de agregação e não pode mais ser agregado.

    Um gráfico que descreve o que acontece quando você coloca um cálculo agregado em uma divisória. O campo exibe o prefixo AGG.

Regras para cálculos agregados

As regras a seguir se aplicam a cálculos de agregação:

  • Em qualquer cálculo de agregação, você não pode combinar um valor agregado e um valor desagregado. Por exemplo, SUM(Price)*[Items] não é uma expressão válida, porque SUM(Price) está agregada e Items não. No entanto, SUM(Price*Items) e SUM(Price)*SUM(Items) são válidas.

  • Termos constantes em uma expressão funcionam como valores agregados ou desagregados, conforme apropriado. Por exemplo: SUM(Price*7) e SUM(Price)*7 são expressões válidas.

  • Todas as funções podem ser avaliadas em valores agregados. Mas, os argumentos de uma função qualquer devem ser todos agregados ou todos desagregados. Por exemplo, MAX(SUM(Sales),Profit) não é uma expressão válida, porque Sales está agregada e Profit não. No entanto, MAX(SUM(Sales),SUM(Profit)) é uma expressão válida.

  • O resultado de um cálculo de agregação é sempre uma medida.

  • Assim como as agregações predefinidas, os cálculos de agregação são calculados corretamente para totais gerais. Consulte Totais gerais para obter mais informações.

Consulte também

Compreensão dos cálculos: cálculos agregados(O link abre em nova janela)

Agregação de dados no Tableau(O link abre em nova janela)

Funções no Tableau

Funções do Tableau (por categoria)(O link abre em nova janela)

Funções do Tableau (em ordem alfabética)

Agradecemos seu feedback!