올바른 계산 유형 선택

선택하는 계산 유형은 분석 요구 사항, 답을 원하는 질문, 비주얼리제이션의 레이아웃에 따라 다릅니다.

분석에 적합한 계산

분석에 사용할 계산 유형을 선택하는 일이 항상 쉬운 것은 아닙니다. 결정 시 다음과 같은 질문과 예를 고려합니다.

참고: 이 콘텐츠는 원래 Tableau Blog에 게시되었습니다. 읽어보려면 A Handy Guide to Choosing the Right Calculation for Your Question(링크가 새 창에서 열림)(질문에 적합한 계산을 선택하는 간편한 안내서)을 참조하십시오.


기본 식 또는 테이블 계산?

질문 1:

필요한 모든 데이터 값이 비주얼리제이션에 이미 있습니까?

  • 대답이 인 경우: 테이블 계산을 사용할 수 있습니다.
  • 대답이 아니요인 경우: 기본 계산을 사용합니다.

:

다음 두 비주얼리제이션을 고려합니다. 왼쪽의 비주얼리제이션은 국가/지역별 총 매출을 보여 주는 막대 차트입니다. 오른쪽의 비주얼리제이션도 국가/지역별 매출을 보여 주지만 매출의 집계가 해제되었습니다.

이러한 비주얼리제이션 각각에 대한 매출의 90번째 백분위수를 어떻게 계산할 수 있습니까?

왼쪽의 막대 차트는 SUM으로 집계됩니다. 따라서 이 뷰의 세부 수준이 충분하지 않아 테이블 계산을 사용할 수 없습니다. 이 예에서 다음 수식을 사용하면 기본 집계 식을 사용하여 각 국가에 대한 매출의 90번째 백분위수를 계산할 수 있습니다.

PERCENTILE([Sales], .90)

결과적으로, 국가별 90번째 백분위수의 값이 각 막대의 레이블로 나타납니다.

하지만 오른쪽 차트에는 모든 판매 주문에 대한 데이터 값이 포함되어 있기 때문에 더 큰 분포와 이상값이 표시됩니다. 이 뷰에는 테이블 계산을 사용할 수 있는 충분한 세부 수준이 있습니다.

분포 구간(테이블 계산에 해당)을 사용하면 각 국가에 대한 매출의 90번째 백분위수를 계산할 수 있습니다. 이 비주얼리제이션에 더 많은 컨텍스트가 있습니다.

두 계산 모두 동일한 값을 구하지만 각각에서 수집하는 심층 정보는 비주얼리제이션의 세부 수준(데이터의 양)에 따라 달라집니다.


기본 식 또는 세부 수준(LOD) 식?

비주얼리제이션에 필요한 모든 데이터가 없는 경우 데이터 원본에 전달할 계산이 필요합니다. 즉, 기본 계산 또는 LOD 식을 사용해야 합니다.

질문 1아니요로 답한 경우 다음 질문을 스스로에게 해 보십시오.

질문 2:

질문의 세부 수준이 비주얼리제이션의 세부 수준 또는 데이터 원본의 세부 수준과 일치합니까?

  • 대답이 인 경우: 기본 식을 사용합니다.
  • 대답이 아니요인 경우: 세부 수준(LOD) 식을 사용합니다.

다음 비주얼리제이션을 살펴보겠습니다. 이 비주얼리제이션은 각 국가의 모든 주문에 대한 매출의 90번째 백분위수를 보여 줍니다.

이 예에서는 Tableau와 함께 제공된 Sample-Superstore 데이터 원본을 사용합니다. Sample-Superstore 데이터 원본에 익숙한 경우 Order ID당 데이터 행 하나가 있다는 것을 알 수 있습니다. 즉, 데이터 원본의 세부 수준은 Order ID입니다. 하지만 비주얼리제이션의 세부 수준은 Country입니다.

Order ID 세부 수준에서 각 국가의 주문에 대한 매출의 90번째 백분위수 값이 무엇인지 알고 싶다면 다음 LOD 식을 사용할 수 있습니다.

 {INCLUDE [Order ID] : SUM([Sales])}

그런 다음 뷰의 90번째 백분위수에서 필드를 집계로 변경할 수 있습니다.

이렇게 하려면 필드 드롭다운을 클릭하고 측정값 > 백분위수 > 90을 선택합니다.

다음 다이어그램에서는 이 경우에 LOD 식이 작동하는 방식을 보여 줍니다.

  1. 데이터는 SUM(Sales)에서 완전히 집계된 상태로 시작된 다음 Country 세부 수준, 즉 SUM(Sales) at Country까지 드릴다운됩니다.
  2. LOD 계산이 적용되고 데이터의 세부 수준이 SUM(Sales) at Country + Order ID로 높아집니다.
  3. > LOD 계산이 90번째 백분위수, 즉 PCT90(SUM(Sales) at Country + Order ID)로 집계됩니다.

결과는 다음과 같습니다.

테이블 계산 또는 세부 수준(LOD) 식?

테이블 계산과 LOD 계산 중에서 선택할 때 프로세스는 테이블 계산과 기본 식 중에서 선택할 때와 매우 비슷합니다. 스스로에게 다음 질문을 해 보십시오.

필요한 모든 데이터 값이 비주얼리제이션에 이미 있습니까?

  • 대답이 인 경우 테이블 계산을 사용합니다.
  • 대답이 아니요인 경우 다음 질문에 답하십시오. 질문의 세부 수준이 비주얼리제이션의 세부 수준 또는 데이터 원본의 세부 수준과 일치합니까? 대답이 아니요인 경우 LOD 계산을 사용합니다.

테이블 계산만 해당

다음을 비롯한 일부 시나리오에서는 테이블 계산만 사용할 수 있습니다.

  • 순위
  • 재귀(예: 누적 총계)
  • 이동 계산(예: 롤링 평균)
  • 행간 계산(예: 기간 대 기간 계산)

분석에 이러한 시나리오가 필요한 경우 테이블 계산을 사용합니다.

다음 비주얼리제이션을 살펴보겠습니다. 2014년 9월부터 2015년 9월까지 여러 주식의 평균 종가를 보여 줍니다.

종가가 현재까지의 기록 종가 값을 초과한 횟수를 보려면 테이블 계산, 특히 재귀 계산을 사용해야 합니다.

이유는 무엇일까요? 기본 및 LOD 식은 각 파티션 또는 데이터 그룹에 대해 단일 값만 출력할 수 있지만 테이블 계산은 데이터의 각 파티션(셀, 패널, 테이블)에 대해 여러 값을 출력할 수 있기 때문입니다.

종가가 각 종목의 기록 종가를 초과한 횟수를 계산하려면 몇 가지 단계를 거쳐야 합니다.

  1. 새로운 최대 종가 값에 도달했는지 결정하려면 먼저 모든 이전 값을 알아야 합니다. 이 작업은 RUNNING_MAX 함수로 수행할 수 있습니다. 예를 들어 Day (across the table)을 사용하여 계산된 Record to Date라는 제목의
    RUNNING_MAX(AVG([Close]))
    계산을 살펴보겠습니다.
  2. 계속해서, 기록이 깨지면 Day (across the table)을 사용하여 계산된 Count Days Record Broken이라는 제목의 다음과 같은 계산을 사용하여 날짜에 플래그를 지정할 수 있습니다.

    IF AVG([Close]) = [Record to Date] 
    THEN 1
    ELSE 0
    END
  3. 마지막으로, Day (across the table)을 사용하여 계산된 다음과 같은 계산을 사용하여 이러한 날짜의 수를 계산할 수 있습니다.

    RUNNING_SUM([Count Days Record Broken])

    최종 계산된 필드를 뷰에 Avg(Close) 대신 추가하면 다음과 같은 결과를 얻을 수 있습니다.


계속해서 계산을 만드는 방법을 학습하기 위한 팁 진행

이 시리즈의 참조 사항:

Tableau의 계산 이해(링크가 새 창에서 열림)

Tableau의 계산 유형(링크가 새 창에서 열림)

피드백을 제공해 주셔서 감사합니다!귀하의 피드백이 제출되었습니다. 감사합니다!