Funções de agregação no Tableau

Este artigo apresenta as funções de agregação e os respectivos usos no Tableau. Ela também demonstra como criar um cálculo agregado com um exemplo.

Por que usar funções de agregação

As funções de agregação permitem que você resuma ou altere a granularidade dos seus dados.

Por exemplo, você pode desejar saber quantos pedidos a sua loja recebeu em um ano específico. Para isso, use a função COUNTD para resumir o número exato de pedidos que a sua empresa recebeu e, em seguida, especificar a visualização por ano.

O cálculo pode ficar mais ou menos assim:

COUNTD(Order ID)

A visualização pode ficar mais ou menos assim:

Funções de agregação disponíveis no Tableau

Agregações e aritmética de ponto flutuante: os resultados de algumas agregações nem sempre podem ser exatamente como desejado. Por exemplo, você pode descobrir que a função Sum retorna um valor como -1.42e-14 para uma coluna de número que você sabe que devem somar exatamente 0. Isso acontece porque o padrão de ponto flutuante 754 do IEEE (Institute of Electrical and Electronics Engineers) exige que os números sejam armazenados em formato binário, o que significa que são, às vezes, arredondados em níveis extremamente sutis de precisão. Você pode eliminar essa possível distração usando a função ROUND (ver Funções de número) ou formatando o número para mostrar menos casas decimais.

ATTR

SintaxeATTR(expression)
DefiniçãoRetorna o valor da expressão caso tenha um único valor para todas as linhas. Do contrário, retorna um asterisco. Os valores nulos são ignorados.

AVG

SintaxeAVG(expression)
DefiniçãoRetorna a média de todos os valores na expressão. Os valores nulos são ignorados.
ObservaçõesAVG pode ser usado apenas com campos numéricos.

COLLECT

SintaxeCOLLECT(spatial)
DefiniçãoUm cálculo agregado que combina os valores no campo do argumento. Os valores nulos são ignorados.
ObservaçõesCOLLECT pode ser usado apenas com campos espaciais.

CORR

SintaxeCORR(expression1, expression2)
SaídaNúmero de -1 a 1
DefiniçãoRetorna o coeficiente de correlação Pearson de duas expressões.
Exemplo
example
Observações

A correlação Pearson mede a relação linear entre duas variáveis. Os resultados variam de -1 a +1 inclusive, em que 1 denota uma relação linear positiva e exata, 0 denota nenhuma relação linear entre a variância e −1 é uma relação negativa exata.

O quadrado de um resultado CORR é equivalente ao valor quadrado de R para um modelo de linha de tendência linear. Consulte Termos do modelo de linha de tendência(O link abre em nova janela).

Use com expressões LOD no escopo da tabela:

Você pode usar CORR para visualizar a correlação em uma dispersão desagregada usando uma Expressão de nível de detalhe com escopo de tabela(O link abre em nova janela). Por exemplo:

{CORR(Sales, Profit)}

Com uma expressão de nível de detalhe, a correlação é executada em todas as linhas. Se usou uma fórmula como CORR(Sales, Profit) (sem estar entre colchetes, para torná-la uma expressão de nível de detalhe), a exibição mostraria a correlação de cada ponto individual no gráfico de dispersão em relação ao outro ponto, que está indefinido.

Limitações do banco de dados

CORR está disponível com as seguintes fontes de dados: extrações de dados do Tableau, Cloudera Hive, EXASolution, Firebird (versão 3.0 e posterior), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata, Vertica.

Para outras fontes de dados, considere extrair os dados ou usar WINDOW_CORR. Consulte Funções de cálculo da tabela(O link abre em nova janela).

COUNT

SintaxeCOUNT(expression)
DefiniçãoRetorna o número de itens. Os valores Null não são contados.

COUNTD

SintaxeCOUNTD(expression)
DefiniçãoRetorna o número de itens distintos em um grupo. Os valores Null não são contados.

COVAR

SintaxeCOVAR(expression1, expression2)
DefiniçãoRetorna a covariância de amostra de duas expressões
Observações

A covariância quantifica como duas variáveis mudam ao mesmo tempo. Uma covariância positiva indica que as variáveis tendem a se mover na mesma direção, como quando valores maiores de uma variável tendem a corresponder aos valores maiores da outra variável, em média. A covariância de amostra usa o número de pontos de dados não nulos, n - 1, para normalizar o cálculo da covariância, em vez de n, que é usado pela covariância populacional (disponível com a função COVARP). A covariância de amostra é a escolha apropriada quando os dados são uma amostra aleatória sendo usada para estimar a covariância de uma população maior.

Se <expression1> e <expression2> forem as mesmas, por exemplo COVAR([profit], [profit]), COVAR retorna um valor que indica quão amplamente os valores são distribuídos.

O valor de COVAR(X, X) é equivalente ao valor de VAR(X) e também ao valor de STDEV(X)^2.

Limitações do banco de dados

COVAR está disponível com as seguintes fontes de dados: extrações de dados do Tableau, Cloudera Hive, EXASolution, Firebird (versão 3.0 e posterior), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata, Vertica.

Para outras fontes de dados, considere extrair os dados ou usar WINDOW_COVAR. Consulte Funções de cálculo da tabela(O link abre em nova janela).

COVARP

SintaxeCOVARP(expression 1, expression2)
DefiniçãoRetorna a covariância populacional de duas expressões.
Observações

A covariância quantifica como duas variáveis mudam ao mesmo tempo. Uma covariância positiva indica que as variáveis tendem a se mover na mesma direção, como quando valores maiores de uma variável tendem a corresponder aos valores maiores da outra variável, em média. A covariância populacional é a covariância de amostra multiplicada por (n-1)/n, em que n é o número total de pontos de dados não nulos. A covariância populacional é a escolha apropriada quando há dados disponíveis para todos os itens de interesse, ao invés de somente um subconjunto aleatório de itens, em que a covariância de amostra (com a função COVAR) é apropriada.

Se <expression1> e <expression2> forem as mesmas, por exemplo COVARP([profit], [profit]), COVARP retorna um valor que indica quão amplamente os valores são distribuídos. Observação: O valor de COVARP(X, X) é equivalente ao valor de VARP(X) e também ao valor de STDEVP(X)^2.

Limitações do banco de dados

COVARP está disponível com as seguintes fontes de dados: extrações de dados do Tableau, Cloudera Hive, EXASolution, Firebird (versão 3.0 e posterior), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata, Vertica

Para outras fontes de dados, considere extrair os dados ou usar WINDOW_COVAR. Consulte Funções de cálculo da tabela(O link abre em nova janela).

MAX

SintaxeMAX(expression) ou MAX(expr1, expr2)
SaídaMesmo tipo de dados do argumento ou NULL se alguma parte do argumento for nula.
Definição

Retorna o máximo de dois argumentos, que devem ser do mesmo tipo de dados.

MAX também pode ser aplicada a um único campo em uma agregação.

Exemplo
MAX(4,7) = 7
MAX(#3/25/1986#, #2/20/2021#) = #2/20/2021#
MAX([Name]) = "Zander"
Observações

Para cadeia de caracteres

MAX geralmente é o valor que vem por último em ordem alfabética.

Para fontes de dados de bancos de dados, o valor de cadeia de caracteres MAX é o mais alto na sequência de classificação definida pelo banco de dados para essa coluna.

Para datas

Para datas, MAX é a data mais recente. Se MAX for uma agregação, o resultado não terá uma hierarquia de datas. Se MAX for uma comparação, o resultado manterá a hierarquia de datas.

Como uma agregação

MAX(expression) é uma função agregada e retorna um único resultado agregado. Isso é exibido como AGG(expression) na visualização.

Como comparação

MAX(expr1, expr2) compara os dois valores e retorna um valor em nível de linha.

Consulte também MIN.

MEDIAN

SintaxeMEDIAN(expression)
DefiniçãoRetorna o mediano de uma expressão em todos os registros. Os valores nulos são ignorados.
ObservaçõesMEDIAN pode ser usado apenas com campos numéricos.
Limitações do banco de dados

MEDIAN não está disponível para as seguintes fontes de dados: Access, Amazon Redshift, Cloudera Hadoop, HP Vertica, IBM DB2, IBM PDA (Netezza), Microsoft SQL Server, MySQL, SAP HANA, Teradata.

Para outros tipos de fonte de dados, é possível extrair os dados para um arquivo de extração para usar essa função. Consulte Extrair seus dados(O link abre em nova janela).

MIN

SintaxeMIN(expression) ou MIN(expr1, expr2)
SaídaMesmo tipo de dados do argumento ou NULL se alguma parte do argumento for nula.
Definição

Retorna o máximo de dois argumentos, que devem ser do mesmo tipo de dados.

MIN também pode ser aplicada a um único campo em uma agregação.

Exemplo
MIN(4,7) = 4
MIN(#3/25/1986#, #2/20/2021#) = #3/25/1986#
MIN([Name]) = "Abebi"
Observações

Para cadeia de caracteres

MIN geralmente é o valor que vem primeiro em ordem alfabética.

Para fontes de dados de bancos de dados, o valor de cadeia de caracteres MIN é o mais baixo na sequência de classificação definida pelo banco de dados para essa coluna.

Para datas

Para datas, o MIN é a data mais antiga. Se MIN for uma agregação, o resultado não terá uma hierarquia de datas. Se MIN for uma comparação, o resultado manterá a hierarquia de datas.

Como uma agregação

MIN(expression) é uma função agregada e retorna um único resultado agregado. Isso é exibido como AGG(expression) na visualização.

Como comparação

MIN(expr1, expr2) compara os dois valores e retorna um valor em nível de linha.

Consulte também MAX.

PERCENTILE

SintaxePERCENTILE(expression, number)
DefiniçãoRetorna o valor percentil da expressão indicada correspondente ao <number> especificado. O <number> deve estar entre 0 e 1 (inclusive) e deve ser uma constante numérica.
Exemplo
PERCENTILE([Score], 0.9)
Observações 
Limitações do banco de dados

Esta função está disponível para as seguintes fontes de dados: conexões não legadas do Microsoft Excel e de arquivo de texto, extrações e tipos de fontes de dados somente de extração (por exemplo, Google Analytics, OData ou Salesforce), fontes de dados Sybase IQ 15.1 e posteriores, fontes de dados Oracle 10 e posteriores, fontes de dados Cloudera Hive e Hortonworks Hadoop Hive, fontes de dados EXASolution 4.2 e posteriores.

Para outros tipos de fonte de dados, é possível extrair os dados para um arquivo de extração para usar essa função. Consulte Extrair seus dados(O link abre em nova janela).

STDEV

SintaxeSTDEV(expression)
DefiniçãoRetorna o desvio padrão estatístico de todos os valores na expressão atribuída com base em uma amostra da população.

STDEVP

SintaxeSTDEVP(expression)
DefiniçãoRetorna o desvio padrão estatístico de todos os valores na expressão atribuída com base em uma tendência de população.

SUM

SintaxeSUM(expression)
DefiniçãoRetorna a soma de todos os valores na expressão. Os valores nulos são ignorados.
ObservaçõesSUM pode ser usado apenas com campos numéricos.

VAR

SintaxeVAR(expression)
DefiniçãoRetorna a variação estatística de todos os valores na expressão atribuída com base em uma amostra da população.

VARP

SintaxeVARP(expression)
DefiniçãoRetorna a variação estatística de todos os valores na expressão atribuída com base na população inteira.

Criar um cálculo agregado

Siga as etapas abaixo para saber como criar um cálculo agregado.

  1. No Tableau Desktop, conecte-se à fonte de dados salva Exemplo - Superloja, incluída no Tableau.

  2. Navegue até a pasta de trabalho e selecione Análise > Criar campo calculado.

  3. No editor de cálculo aberto, faça o seguinte:

    • Nomeie o campo calculado de Margem.

    • Insira a fórmula a seguir:

      IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)

      Observação: é possível usar a referência da função para encontrar e adicionar as funções de agregação e outras funções (como a função lógica IIF neste exemplo) à fórmula de cálculo. Para obter mais informações, consulte Usar a referência de funções no editor de cálculo.

    • Ao terminar, clique em OK.

    O novo cálculo agregado aparece em Medidas no painel Dados. Assim como os outros campos, é possível usá-lo em uma ou mais visualizações.

    Observação: os cálculos agregados são sempre medidas.

    Quando a Margem é colocada em uma divisória ou cartão na planilha, seu nome é alterado para AGG(Margem), indicando que é um cálculo de agregação e não pode mais ser agregado.

    Um gráfico que descreve o que acontece quando você coloca um cálculo agregado em uma divisória. O campo exibe o prefixo AGG.

Regras para cálculos agregados

As regras a seguir se aplicam a cálculos de agregação:

  • Em qualquer cálculo de agregação, você não pode combinar um valor agregado e um valor desagregado. Por exemplo, SUM(Price)*[Items] não é uma expressão válida, porque SUM(Price) está agregada e Items não. No entanto, SUM(Price*Items) e SUM(Price)*SUM(Items) são válidas.

  • Termos constantes em uma expressão funcionam como valores agregados ou desagregados, conforme apropriado. Por exemplo: SUM(Price*7) e SUM(Price)*7 são expressões válidas.

  • Todas as funções podem ser avaliadas em valores agregados. Mas, os argumentos de uma função qualquer devem ser todos agregados ou todos desagregados. Por exemplo, MAX(SUM(Sales),Profit) não é uma expressão válida, porque Sales está agregada e Profit não. No entanto, MAX(SUM(Sales),SUM(Profit)) é uma expressão válida.

  • O resultado de um cálculo de agregação é sempre uma medida.

  • Assim como as agregações predefinidas, os cálculos de agregação são calculados corretamente para totais gerais. Consulte Totais gerais para obter mais informações.

Consulte também

Compreensão dos cálculos: cálculos agregados(O link abre em nova janela)

Agregação de dados no Tableau(O link abre em nova janela)

Funções no Tableau

Funções do Tableau (por categoria)(O link abre em nova janela)

Funções do Tableau (em ordem alfabética)

Agradecemos seu feedback!