Tableau의 집계 함수

적용 대상: Tableau Cloud, Tableau Desktop, Tableau Public, Tableau Server

이 문서에서는 Tableau의 집계 함수와 관련 사용법을 소개합니다. 또한 예제를 사용하여 집계 계산을 만드는 방법을 보여 줍니다.

집계 함수를 사용하는 이유

집계 함수를 사용하면 데이터를 요약하거나 세부 수준을 변경할 수 있습니다.

예를 들어 특정 연도에 상점이 처리한 주문 수를 정확히 알고 싶다고 가정합니다. COUNTD 함수를 사용하면 회사의 정확한 고유 주문 수를 집계한 다음 비주얼리제이션을 연도별로 분류할 수 있습니다.

계산은 다음과 비슷한 모양입니다.

COUNTD(Order ID)

비주얼리제이션은 다음과 비슷한 모양입니다.

Tableau에서 사용할 수 있는 집계 함수

집계 및 부동 소수점 산술: 일부 집계의 결과가 항상 예상한 결과와 정확하게 일치하는 것은 아닙니다. 예를 들어 SUM 함수는 합계가 정확하게 0이 되어야 한다고 간주되는 숫자 열에 대해 -1.42e-14와 같은 값을 반환한다는 사실을 발견할 수 있습니다. 이는 IEEE(Institute of Electrical and Electronics Engineers) 754 부동 소수점 표준에 따라 숫자는 이진 형식으로 저장해야 하기 때문입니다. 즉, 숫자는 때때로 매우 세밀한 정밀도 수준에서 반올림/반내림됩니다. 소수 자릿수를 덜 표시하도록 숫자의 형식을 지정하거나 ROUND 함수(숫자 함수 참조)를 사용하여 이 잠재적 혼란을 없앨 수 있습니다.

ATTR

구문	`ATTR(expression)`
정의	모든 행에 대해 단일 값이 있으면 식의 값을 반환합니다. 그렇지 않으면 별표를 반환합니다. Null 값은 무시됩니다.

AVG

구문	`AVG(expression)`
정의	식에서 모든 값의 평균을 반환합니다. Null 값은 무시됩니다.
참고	`AVG`는 숫자 필드에서만 사용할 수 있습니다.

COLLECT

구문	`COLLECT(spatial)`
정의	인수 필드의 값을 결합하는 집계 계산입니다. Null 값은 무시됩니다.
참고	`COLLECT`는 공간 필드에만 사용할 수 있습니다.

CORR

구문	`CORR(expression1, expression2)`
출력	-1부터 1까지의 숫자
정의	두 식의 피어슨 상관 계수를 반환합니다.
예	example
참고	피어슨 상관 계수는 두 변수 간의 선형 관계를 측정합니다. 결과는 -1에서 +1(포함) 사이이며, 1은 정확한 양의 선형 관계를 나타내고 0은 변화 사이에 선형 관계가 없음을 나타내고, −1은 정확한 음의 관계를 나타냅니다. CORR 결과의 제곱은 선형 추세선 모델의 R-제곱 값에 해당합니다. 자세한 내용은 추세선 모델 용어(링크가 새 창에서 열림)를 참조하십시오. 테이블 범위 LOD 식과 함께 사용: CORR을 사용하면 테이블 범위 세부 수준 식(링크가 새 창에서 열림)을 통해 집계되지 않은 분산의 상관 관계를 시각화할 수 있습니다. 예: {CORR(Sales, Profit)} 세부 수준 식을 사용하면 상관 관계가 모든 행에서 실행됩니다. `CORR(Sales, Profit)`(세부 수준 식으로 만들려면 대괄호로 묶지 않아야 함) 같은 수식을 사용하는 경우 분산형 차트의 개별 점과 다른 점 간의 상관 관계(아직 정의되지 않음)가 뷰에 표시됩니다.
데이터베이스 제한 사항	`CORR`는 Tableau 데이터 추출, Cloudera Hive, EXASolution, Firebird(버전 3.0 이상), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA(Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata, Vertica와 같은 데이터 원본에서 사용할 수 있습니다. 다른 데이터 원본의 경우 데이터를 추출하거나 `WINDOW_CORR`를 사용하십시오. 테이블 계산 함수(링크가 새 창에서 열림)를 참조하십시오.

COUNT

구문	`COUNT(expression)`
정의	항목 수를 반환합니다. Null 값은 계산되지 않습니다.

COUNTD

구문	`COUNTD(expression)`
정의	그룹의 고유 항목 수를 반환합니다. Null 값은 계산되지 않습니다.

COVAR

구문	`COVAR(expression1, expression2)`
정의	두 식의 표본 공분산을 반환합니다.
참고	공분산은 두 변수가 함께 변화하는 정도를 정량화합니다. 양의 공분산은 두 변수가 같은 방향으로 이동하는 경향을 나타냅니다. 즉, 한 변수의 값이 커질수록 다른 변수의 값도 평균적으로 커집니다. 표본 공분산에서는 Null이 아닌 n - 1개의 데이터 요소를 사용하여 공분산 계산을 정규화합니다. 모집단 공분산(`COVARP` 함수로 사용할 수 있음)에서 사용되는 n개가 아니라는 것에 주의하십시오. 데이터가 대규모 모집단의 분산을 예측하는 데 사용되는 임의 샘플인 경우 표본 공분산을 선택하는 것이 좋습니다. `COVAR([profit], [profit])` 같이 `<expression1>`과 `<expression2>`가 동일한 경우 `COVAR`은 값이 분산된 정도를 나타내는 값을 반환합니다. `COVAR(X, X)` 값은 `VAR(X)` 값에 해당하며 `STDEV(X)^2` 값에도 해당합니다.
데이터베이스 제한 사항	`COVAR`는 Tableau 데이터 추출, Cloudera Hive, EXASolution, Firebird(버전 3.0 이상), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA(Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata, Vertica와 같은 데이터 원본에서 사용할 수 있습니다. 다른 데이터 원본의 경우 데이터를 추출하거나 `WINDOW_COVAR`를 사용하십시오. 테이블 계산 함수(링크가 새 창에서 열림)를 참조하십시오.

COVARP

구문	`COVARP(expression 1, expression2)`
정의	두 식의 모집단 공분산을 반환합니다.
참고	공분산은 두 변수가 함께 변화하는 정도를 정량화합니다. 양의 공분산은 두 변수가 같은 방향으로 이동하는 경향을 나타냅니다. 즉, 한 변수의 값이 커질수록 다른 변수의 값도 평균적으로 커집니다. 모집단 공분산은 표본 공분산에 (n-1)/n을 곱한 값입니다. 여기서, n은 Null이 아닌 데이터 요소의 총 수입니다. 항목의 임의 하위 집합만 있어 `COVAR` 함수를 사용하는 표본 공분산이 적합한 경우와 달리 관심 대상인 모든 항목에서 데이터를 사용할 수 있는 경우 모집단 공분산을 선택하는 것이 좋습니다. `COVARP([profit], [profit])` 같이 `<expression1>`과 `<expression2>`가 동일한 경우 `COVARP`은 값이 분산된 정도를 나타내는 값을 반환합니다. 참고: `COVARP(X, X)` 값은 `VARP(X)` 값에 해당하며 `STDEVP(X)^2` 값에도 해당합니다.
데이터베이스 제한 사항	`COVARP`은 Tableau 데이터 추출, Cloudera Hive, EXASolution, Firebird(버전 3.0 이상), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA(Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata, Vertica와 같은 데이터 원본에서 사용할 수 있습니다. 다른 데이터 원본의 경우 데이터를 추출하거나 `WINDOW_COVAR`를 사용하십시오. 테이블 계산 함수(링크가 새 창에서 열림)를 참조하십시오.

MAX

구문	`MAX(expression)` 또는 `MAX(expr1, expr2)`
출력	인수와 동일한 데이터 유형이거나, 인수의 일부가 null인 경우 `NULL` 값이 출력됩니다.
정의	두 인수의 최대값을 반환합니다(두 인수가 동일한 데이터 유형이어야 함). `MAX` 함수를 단일 필드에 집계로 적용할 수도 있습니다.
예	MAX(4,7) = 7 MAX(#3/25/1986#, #2/20/2021#) = #2/20/2021# MAX([Name]) = "Zander"
참고	문자열의 경우 `MAX`는 일반적으로 사전순으로 마지막에 오는 값입니다. 데이터베이스 데이터 원본의 경우 `MAX` 문자열 값은 데이터베이스가 해당 열에 정의한 정렬 순서에서 가장 높은 값을 찾습니다. 날짜의 경우 날짜의 경우 `MAX`는 가장 최근 날짜입니다. `MAX`가 집계인 경우 결과에 날짜 계층 구조가 없습니다. `MAX`가 비교인 경우 결과에 날짜 계층 구조가 유지됩니다. 집계 형식 `MAX(expression)`는 집계 함수이며 단일 집계 결과를 반환합니다. 이는 비주얼리제이션에서 `AGG(expression)`와 같이 표시됩니다. 비교 형식 `MAX(expr1, expr2)`는 두 값을 비교하여 행 수준 값을 반환합니다. `MIN`도 참조하십시오.

MEDIAN

구문	`MEDIAN(expression)`
정의	모든 레코드에 대한 식의 중앙값을 반환합니다. Null 값은 무시됩니다.
참고	`MEDIAN`는 숫자 필드에서만 사용할 수 있습니다.
데이터베이스 제한 사항	`MEDIAN`은 데이터 원본이 Access, Amazon Redshift, Cloudera Hadoop, HP Vertica, IBM DB2, IBM PDA (Netezza), Microsoft SQL Server, MySQL, SAP HANA, Teradata인 경우 사용할 수 없습니다. 다른 데이터 원본의 경우 데이터를 추출 파일로 추출하여 이 함수를 사용할 수 있습니다. 데이터 추출(링크가 새 창에서 열림)을 참조하십시오.

MIN

구문	`MIN(expression)` 또는 `MIN(expr1, expr2)`
출력	인수와 동일한 데이터 유형이거나, 인수의 일부가 null인 경우 `NULL` 값이 출력됩니다.
정의	두 인수의 최소값을 반환합니다(두 인수가 동일한 데이터 유형이어야 함). `MIN` 함수를 단일 필드에 집계로 적용할 수도 있습니다.
예	MIN(4,7) = 4 MIN(#3/25/1986#, #2/20/2021#) = #3/25/1986# MIN([Name]) = "Abebi"
참고	문자열의 경우 `MIN`은 일반적으로 사전순으로 맨 처음 나타나는 값입니다. 데이터베이스 데이터 원본의 경우 `MIN` 문자열 값은 데이터베이스가 해당 열에 정의한 정렬 순서에서 가장 낮은 값을 찾습니다. 날짜의 경우 날짜의 경우 `MIN`은 가장 이른 날짜입니다. `MIN`가 집계인 경우 결과에 날짜 계층 구조가 없습니다. `MIN`가 비교인 경우 결과에 날짜 계층 구조가 유지됩니다. 집계 형식 `MIN(expression)`는 집계 함수이며 단일 집계 결과를 반환합니다. 이는 비주얼리제이션에서 `AGG(expression)`와 같이 표시됩니다. 비교 형식 `MIN(expr1, expr2)`는 두 값을 비교하여 행 수준 값을 반환합니다. `MAX`도 참조하십시오.

PERCENTILE

구문	`PERCENTILE(expression, number)`
정의	지정된 식에서 지정한 `<number>`에 해당하는 백분위수 값을 반환합니다. `<number>`는 0과 1을 포함하여 0에서 1 사이의 상수여야 합니다.
예	PERCENTILE([Score], 0.9)
데이터베이스 제한 사항	이 함수는 레거시가 아닌 Microsoft Excel 및 텍스트 파일 연결, 추출 및 추출 전용 데이터 원본 유형(예: Google Analytics, OData 또는 Salesforce), Sybase IQ 15.1 이상 데이터 원본, Oracle 10 이상 데이터 원본, Cloudera Hive 및 Hortonworks Hadoop Hive 데이터 원본, EXASolution 4.2 이상 데이터 원본 등의 데이터 원본에 사용할 수 있습니다. 다른 데이터 원본의 경우 데이터를 추출 파일로 추출하여 이 함수를 사용할 수 있습니다. 데이터 추출(링크가 새 창에서 열림)을 참조하십시오.

STDEV

구문	`STDEV(expression)`
정의	샘플 모집단을 기준으로 주어진 식에 있는 모든 값의 통계적 표준 편차를 반환합니다.

STDEVP

구문	`STDEVP(expression)`
정의	편향 모집단을 기준으로 주어진 식에 있는 모든 값의 통계적 표준 편차를 반환합니다.

SUM

구문	`SUM(expression)`
정의	식에서 모든 값의 합계를 반환합니다. Null 값은 무시됩니다.
참고	`SUM`는 숫자 필드에서만 사용할 수 있습니다.

VAR

구문	`VAR(expression)`
정의	샘플 모집단을 기준으로 주어진 식에 있는 모든 값의 통계적 분산을 반환합니다.

VARP

구문	`VARP(expression)`
정의	전체 모집단을 기준으로 주어진 식에 있는 모든 값의 통계적 분산을 반환합니다.

집계 계산 만들기

아래의 단계를 수행하여 집계 계산을 만드는 방법을 배워 보십시오.

Tableau Desktop에서 Tableau와 함께 제공된 샘플 – 슈퍼스토어라는 저장된 데이터 원본에 연결합니다.
워크시트로 이동하고 분석 > 계산된 필드 만들기를 선택합니다.
계산 에디터가 열리면 다음을 수행합니다.
- 계산된 필드의 이름을 Margin으로 지정합니다.
- 다음 수식을 입력합니다.
  IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)
  참고: 함수 참조를 사용하여 집계 함수 및 다른 함수(이 예의 경우 논리 IIF 함수)를 찾고 계산 수식에 추가할 수 있습니다. 자세한 내용은 계산 에디터에서 함수 참조 사용을 참조하십시오.
- 작업을 마쳤으면 확인을 클릭합니다.
새 집계 계산이 데이터 패널의 측정값 아래에 나타납니다. 다른 필드와 마찬가지로, 하나 이상의 비주얼리제이션에서 이 필드를 사용할 수 있습니다.
참고: 집계 계산은 항상 측정값입니다.
Margin을 워크시트의 카드 또는 선반에 배치하면 해당 이름이 AGG(Margin)으로 자동 변경되어 집계 계산임을 알 수 있으며 더 이상 집계할 수 없습니다.

집계 계산의 규칙

집계 계산에 적용되는 규칙은 다음과 같습니다.

집계 계산에 집계된 값과 집계 해제된 값을 함께 사용할 수 없습니다. 예를 들어 SUM(Price)*[Items]는 SUM(Price)만 집계이고 Items는 집계가 아니기 때문에 유효한 식이 아닙니다. 그러나, SUM(Price*Items) 및 SUM(Price)*SUM(Items)는 모두 유효합니다.
식의 상수 항은 집계된 값이나 집계 해제된 값으로 적절하게 적용됩니다. 예를 들면 다음과 같습니다. SUM(Price*7)과 SUM(Price)*7은 둘 다 유효한 식입니다.
집계된 값에서 모든 함수를 계산할 수 있습니다. 그러나 지정된 함수의 인수는 모두 집계된 상태이거나 모두 집계 해제된 상태여야 합니다. 예를 들어 MAX(SUM(Sales),Profit)의 경우 Sales는 집계되고 Profit은 집계되지 않기 때문에 유효한 식이 아닙니다. 그러나, MAX(SUM(Sales),SUM(Profit))는 유효한 식입니다.
집계 계산의 결과는 항상 측정값입니다. 여기에는 ATTR(차원) 또는 MIN(차원)과 같은 식이 포함됩니다.
미리 정의된 집계와 마찬가지로 집계 계산을 통해 총합계를 올바르게 계산할 수 있습니다. 자세한 내용은 총합계를 참조하십시오.