Tableau의 집계 함수
이 문서에서는 Tableau의 집계 함수와 관련 사용법을 소개합니다. 또한 예제를 사용하여 집계 계산을 만드는 방법을 보여 줍니다.
집계 함수를 사용하는 이유
집계 함수를 사용하면 데이터를 요약하거나 세부 수준을 변경할 수 있습니다.
예를 들어 특정 연도에 상점이 처리한 주문 수를 정확히 알고 싶다고 가정합니다. COUNTD 함수를 사용하면 회사가 처리한 정확한 주문 수를 요약한 다음 1년 단위로 비주얼리제이션에 표시할 수 있습니다.
계산은 다음과 비슷한 모양입니다.
COUNTD(Order ID)
비주얼리제이션은 다음과 비슷한 모양입니다.
Tableau에서 사용할 수 있는 집계 함수
집계 및 부동 소수점 산술: 일부 집계의 결과가 항상 예상한 결과와 정확하게 일치하는 것은 아닙니다. 예를 들어 Sum 함수는 합계가 정확하게 0이 되어야 한다고 간주되는 숫자 열에 대해 -1.42e-14와 같은 값을 반환한다는 사실을 발견할 수 있습니다. 이는 IEEE(Institute of Electrical and Electronics Engineers) 754 부동 소수점 표준에 따라 숫자는 이진 형식으로 저장해야 하기 때문입니다. 즉, 숫자는 때때로 매우 세밀한 정밀도 수준에서 반올림/반내림됩니다. 소수 자릿수를 덜 표시하도록 숫자의 형식을 지정하거나 ROUND 함수(숫자 함수 참조)를 사용하여 이 잠재적 혼란을 없앨 수 있습니다.
함수 | 구문 | 정의 |
ATTR |
| 모든 행에 대해 단일 값이 있으면 식의 값을 반환합니다. 그렇지 않으면 별표를 반환합니다. Null 값은 무시됩니다. |
AVG |
| 식에서 모든 값의 평균을 반환합니다. AVG는 숫자 필드에서만 사용할 수 있습니다. Null 값은 무시됩니다. |
COLLECT |
| 인수 필드의 값을 결합하는 집계 계산입니다. Null 값은 무시됩니다. 참고: COLLECT 함수는 공간 필드에만 사용할 수 있습니다. 예:
|
CORR |
| 두 식의 피어슨 상관 계수를 반환합니다. 피어슨 상관 계수는 두 변수 간의 선형 관계를 측정합니다. 결과는 -1에서 +1(포함) 사이이며, 1은 정확한 양의 선형 관계 즉, 한 변수가 양의 방향으로 변화하면 다른 변수도 해당하는 양만큼 양의 방향으로 변화하는 관계를 나타내고 0은 변화 사이에 선형 관계가 없음을 나타내고, −1은 정확한 음의 관계를 나타냅니다. CORR은 다음과 같은 데이터 원본에서 사용할 수 있습니다.
다른 데이터 원본의 경우 데이터를 추출하거나 WINDOW_CORR을 사용하십시오. 자세한 내용은 테이블 계산 함수를 참조하십시오. 참고: CORR 결과의 제곱은 선형 추세선 모델의 R-제곱 값에 해당합니다. 자세한 내용은 추세선 모델 용어를 참조하십시오. 예: CORR을 사용하여 집계 해제된 분산형 차트의 상관 관계를 시각화할 수 있습니다. 이 작업을 수행하는 방법은 테이블 범위 세부 수준 식을 사용하는 것입니다. 예:
세부 수준 식을 사용하면 상관 관계가 모든 행에서 실행됩니다. 자세한 내용은 테이블 범위를 참조하십시오. |
COUNT |
| 그룹의 항목 수를 반환합니다. Null 값은 계산되지 않습니다. |
COUNTD |
| 그룹의 고유 항목 수를 반환합니다. Null 값은 계산되지 않습니다. 이 함수는 Microsoft Excel 또는 텍스트 파일 데이터 원본을 사용하는 Tableau Desktop 8.2 이전에 만든 통합 문서, 레거시 연결을 사용하는 통합 문서 또는 Microsoft Access 데이터 원본을 사용하는 통합 문서에서 사용할 수 없습니다. 이 함수를 사용하려면 데이터를 추출 파일로 추출합니다. 데이터 추출을 참조하십시오. |
COVAR |
| 두 식의 표본 공분산을 반환합니다. 공분산은 두 변수가 함께 변화하는 정도를 정량화합니다. 양의 공분산은 두 변수가 같은 방향으로 이동하는 경향을 나타냅니다. 즉, 한 변수의 값이 커질수록 다른 변수의 값도 평균적으로 커집니다. 표본 공분산에서는 Null이 아닌 n - 1개의 데이터 요소를 사용하여 공분산 계산을 정규화합니다. 모집단 공분산(COVARP 함수로 사용할 수 있음)에서 사용되는 n개가 아니라는 것에 주의하십시오. 데이터가 대규모 모집단의 분산을 예측하는 데 사용되는 임의 샘플인 경우 표본 공분산을 선택하는 것이 좋습니다. COVAR은 다음과 같은 데이터 원본에서 사용할 수 있습니다.
다른 데이터 원본의 경우 데이터를 추출하거나 WINDOW_COVAR을 사용하십시오. 자세한 내용은 테이블 계산 함수를 참조하십시오. COVAR([profit], [profit]) 같이 식1과 식2가 동일한 경우 COVAR은 값이 분산된 정도를 나타내는 값을 반환합니다. 참고: COVAR(X, X) 값은 VAR(X) 값에 해당하며 STDEV(X)^2 값에도 해당합니다. 예: 다음 수식은 Sales 및 Profit의 표본 공분산을 반환합니다.
|
COVARP |
| 두 식의 모집단 공분산을 반환합니다. 공분산은 두 변수가 함께 변화하는 정도를 정량화합니다. 양의 공분산은 두 변수가 같은 방향으로 이동하는 경향을 나타냅니다. 즉, 한 변수의 값이 커질수록 다른 변수의 값도 평균적으로 커집니다. 모집단 공분산은 표본 공분산에 (n-1)/n을 곱한 값입니다. 여기서, n은 Null이 아닌 데이터 요소의 총 수입니다. 항목의 임의 하위 집합만 있어 COVAR 함수를 사용하는 표본 공분산이 적합한 경우와 달리 관심 대상인 모든 항목에서 데이터를 사용할 수 있는 경우 모집단 공분산을 선택하는 것이 좋습니다. COVARP는 다음과 같은 데이터 원본에서 사용할 수 있습니다.
다른 데이터 원본의 경우 데이터를 추출하거나 WINDOW_COVARP를 사용하십시오. 자세한 내용은 테이블 계산 함수를 참조하십시오. COVARP([profit], [profit]) 같이 식1과 식2가 동일한 경우 COVARP는 값이 분산된 정도를 나타내는 값을 반환합니다. 참고: COVARP(X, X) 값은 VARP(X) 값에 해당하며 STDEVP(X)^2 값에도 해당합니다. 예: 다음 수식은 Sales 및 Profit의 모집단 공분산을 반환합니다.
|
MAX |
| 모든 레코드에 대한 식의 최대값을 반환합니다. 식이 문자열 값이면 이 함수는 사전순으로 정의된 마지막 값을 반환합니다. |
MEDIAN |
| 모든 레코드에 대한 식의 중앙값을 반환합니다. 중앙값은 숫자 필드에서만 사용할 수 있습니다. Null 값은 무시됩니다. 이 함수는 Tableau Desktop 8.2 이전 버전에서 만든 통합 문서나 레거시 연결을 사용하는 통합 문서에서는 사용할 수 없습니다. 또한 다음과 같은 데이터 원본을 사용하는 연결에서도 사용할 수 없습니다.
다른 데이터 원본의 경우 데이터를 추출 파일로 추출하여 이 함수를 사용할 수 있습니다. 데이터 추출을 참조하십시오. |
MIN |
| 모든 레코드에 대한 식의 최소값을 반환합니다. 식이 문자열 값이면 이 함수는 사전순으로 정의된 첫 번째 값을 반환합니다. |
PERCENTILE |
| 지정한 수에 해당하는 지정된 식에서 백분위수 값을 반환합니다. 수는 0과 1을 포함하여 0에서 1 사이(예: 0.66)의 숫자 상수여야 합니다. 이 함수는 다음과 같은 데이터 원본에 사용할 수 있습니다.
다른 데이터 원본의 경우 데이터를 추출 파일로 추출하여 이 함수를 사용할 수 있습니다. 데이터 추출을 참조하십시오. |
STDEV |
| 샘플 모집단을 기준으로 주어진 식에 있는 모든 값의 통계적 표준 편차를 반환합니다. |
STDEVP |
| 편향 모집단을 기준으로 주어진 식에 있는 모든 값의 통계적 표준 편차를 반환합니다. |
SUM |
| 식에서 모든 값의 합계를 반환합니다. SUM은 숫자 필드에서만 사용할 수 있습니다. Null 값은 무시됩니다. |
VAR |
| 샘플 모집단을 기준으로 주어진 식에 있는 모든 값의 통계적 분산을 반환합니다. |
VARP |
| 전체 모집단을 기준으로 주어진 식에 있는 모든 값의 통계적 분산을 반환합니다. |
집계 계산 만들기
아래의 단계를 수행하여 집계 계산을 만드는 방법을 배워 보십시오.
Tableau Desktop에서 Tableau와 함께 제공된 샘플 – 슈퍼스토어라는 저장된 데이터 원본에 연결합니다.
워크시트로 이동하고 분석 > 계산된 필드 만들기를 선택합니다.
계산 에디터가 열리면 다음을 수행합니다.
계산된 필드의 이름을 Margin으로 지정합니다.
다음 수식을 입력합니다.
IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)
참고: 함수 참조를 사용하여 집계 함수 및 다른 함수(이 예의 경우 논리 IIF 함수)를 찾고 계산 수식에 추가할 수 있습니다. 자세한 내용은 계산 에디터에서 함수 참조 사용을 참조하십시오.
작업을 마쳤으면 확인을 클릭합니다.
새 집계 계산이 데이터 패널의 측정값 아래에 나타납니다. 다른 필드와 마찬가지로, 하나 이상의 비주얼리제이션에서 이 필드를 사용할 수 있습니다.
참고: 집계 계산은 항상 측정값입니다.
Margin을 워크시트의 카드 또는 선반에 배치하면 해당 이름이 AGG(Margin)으로 자동 변경되어 집계 계산임을 알 수 있으며 더 이상 집계할 수 없습니다.
집계 계산의 규칙
집계 계산에 적용되는 규칙은 다음과 같습니다.
집계 계산에 집계된 값과 집계 해제된 값을 함께 사용할 수 없습니다. 예를 들어 SUM(Price)*[Items]는 SUM(Price)만 집계이고 Items는 집계가 아니기 때문에 유효한 식이 아닙니다. 하지만 SUM(Price*Items) 및 SUM(Price)*SUM(Items)는 모두 유효합니다.
식의 상수 항은 집계된 값이나 집계 해제된 값으로 적절하게 적용됩니다. 예를 들어 SUM(Price*7) 및 SUM(Price)*7은 모두 유효한 식입니다.
집계된 값에서 모든 함수를 계산할 수 있습니다. 그러나 지정된 함수의 인수는 모두 집계된 상태이거나 모두 집계 해제된 상태여야 합니다. 예를 들어 MAX(SUM(Sales),Profit)는 Sales만 집계이고 Profit은 집계가 아니기 때문에 유효한 식이 아닙니다. 하지만 MAX(SUM(Sales),SUM(Profit))는 유효한 식입니다.
집계 계산의 결과는 항상 측정값입니다.
미리 정의된 집계와 마찬가지로 집계 계산을 통해 총합계를 올바르게 계산할 수 있습니다. 자세한 내용은 총합계를 참조하십시오.