Tableau 데이터 스토리 설정 구성: 분석

Tableau 데이터 스토리에 대한 중요 변경 사항

Tableau 데이터 스토리는 2025년 1월(2025.1)에 Tableau Desktop, Tableau CloudTableau Server에서 사용 중지됩니다. Tableau는 자연어 기술의 발전으로 더 쉽게 데이터에 대해 질문하고 최신 변경 내용을 파악할 수 있도록 향상된 인터페이스를 개발하고 있습니다. 자세한 내용은 Tableau AI 기반 Tableau Pulse가 데이터 환경을 재구성하는 방법(영문)(링크가 새 창에서 열림)을 참조하십시오.

Tableau 데이터 스토리 안에서 기록할 분석과 분석을 기록할 시기를 선택할 수 있습니다. 스토리 유형과 스토리의 차원 및 측정값 수에 따라 다양한 유형의 분석을 사용할 수 있습니다. 그러나 현재 분산형 차트 스토리 유형에는 분석이 지원되지 않습니다. 자세한 내용은 Tableau 데이터 스토리에 적합한 스토리 유형 선택을 참조하십시오.

스토리에 대한 분석 구성

  1. 대시보드에 Tableau 데이터 스토리 추가.
  2. 대시보드에서 데이터 스토리 개체의 왼쪽 맨 위에 있는 설정 아이콘을 클릭합니다.
  3. 데이터 스토리 대화 상자에서 분석 탭을 클릭합니다.
  4. 스위치를 클릭하여 다양한 유형의 분석을 설정합니다.
  5. 세그먼트추세선에서 설정을 확장하여 이러한 분석을 수행하기 위한 임계값을 설정합니다.
  6. 저장을 클릭합니다.

다양한 유형의 분석 이해

상관 관계

상관 관계를 사용하면 두 계열 간의 실제 통계적 상관 관계를 식별할 수 있습니다. 계열이 3개 이상인 경우 모든 조합의 상관 관계가 분석합니다. 예를 들어 두 제품이 함께 구매되는 시기를 식별하려는 경우 상관 관계를 설정할 수 있습니다.

클러스터링

클러스터링을 사용하면 단일의 통계 분석을 사용하여 데이터 요소의 고유 그룹(클러스터)을 식별할 수 있습니다. 예를 들어 특정 지역에서 제품의 인기가 매우 높아지는 시기를 식별하려는 경우 클러스터링을 설정할 수 있습니다.

분포

분포를 사용하면 평균, 중앙값, 왜도 등의 비통계적 관측을 사용하여 데이터 요소의 상대적 순위를 지정할 수 있습니다. 예를 들어 수익률이 가장 높은 제품을 식별하려는 경우 분포를 설정할 수 있습니다.

세그먼트

세그먼트를 사용하면 계열 내의 데이터 요소에 대한 중요한 변경을 하이라이트할 수 있습니다. 먼저, 세그먼트에서 기록하려는 변경의 최소 비율을 설정합니다. 정의된 임계값 미만의 변경은 기록되지 않습니다. 예를 들어 변경의 세그먼트 임계값을 60% 이상으로 설정할 경우 시계열에서 30% 하락한 저점은 스토리에 기록되지 않습니다.

임계값을 설정한 후에는 서식 지정 적용 여부를 선택하고 서식을 지정할 변경의 최소 비율을 설정합니다.

추세선

추세선을 사용하면 선형 최적선을 계산하고 정의된 신뢰도 비율 안에 포함되는 데이터를 식별할 수 있습니다. 변동성이 높은 데이터는 보다 일관된 데이터보다 신뢰도 수준이 낮으며 신뢰도 수준은 추세선의 기록 여부에 영향을 미칩니다. 추세선을 차원 1개와 측정값 1개가 있는 스토리에 사용하거나 드릴다운에서 사용할 수 있습니다. 드릴다운에 대한 자세한 내용은 Tableau 데이터 스토리 설정 구성: 서술을 참조하십시오.

추세선에 대한 신뢰도의 최소 비율을 설정합니다. 임계값을 95%에서 설정한 경우 추세선이 90% 신뢰도를 그리면 스토리에 추세선이 기록되지 않습니다. 임계값을 설정한 후 서식 지정 적용 여부를 선택합니다. 그런 다음 서식을 지정할 변경의 최소 비율을 설정합니다.

추세선에 대한 Tableau 데이터 스토리는 기간별 절대 변경을 전달합니다. 추세선에 대해 기록된 스토리는 스토리에 설정된 세부 정보 표시 수준에 따라 다릅니다. 스토리에 높은 세부 정보 표시 수준이 사용되는 경우 추세선에 대한 데이터의 적합도를 수량화하는 통계 개념인 R-제곱 값이 스토리에 기록됩니다. 세부 정보 표시 설정에 대한 자세한 내용은 Tableau 데이터 스토리 설정 구성: 서술을 참조하십시오.

추세선 설정에서 스토리에 예측을 기록할 향후 기간을 선택할 수도 있습니다. 예측을 사용하면 스토리의 추세선에 향후 기간에 대한 예측 값을 계산하는 기울기와 절편이 사용됩니다. 예측의 신뢰도는 추세선에 설정된 신뢰도 임계값에 상한 및 하한을 추가합니다. 예측은 스토리에 선형 데이터 요소가 30개 이상 있는 경우 사용할 수 있습니다.

변동성

변동성을 사용하면 시간대별 표준 편차를 분석할 수 있습니다. 예를 들어 데이터의 평균 범위를 벗어나는 값에 대한 스토리를 쓰려면 변동성을 사용합니다.

분석을 사용하여 스토리를 생성하는 방법

이제 다양한 스토리 유형에 대한 분석이 어떻게 작동하는지 궁금할 것입니다. 각 스토리 유형의 예제를 살펴보고 스토리의 각 문장을 분류해 보겠습니다.

불연속형 스토리에 대한 분석 이해

연속형 스토리는 시간대별 추세를 측정하기 때문에 데이터 스토리는 성능, 진행률, 평균, 합계, 연속성, 변동성, 세그먼트 및 예측을 기록합니다.

연속성 스토리에 대한 다음 예제는 월별 매출에 대한 것입니다.

월별 매출에 대한 텍스트 인사이트가 포함된 예제 스토리 이 이미지의 텍스트는 다음 표에 전사되었습니다.

예제 스토리스토리 분류
  • Average Sales(평균 매출)는 48개월 전체에서 $47,858였습니다.
  • 최소값은 $4,520(2014년 2월)였고 최대값은 $118,448(2017년 11월)였습니다.
처음 두 문장은 평균과 범위 함수를 사용하여 분석 기간의 평균, 최대값 및 최소값에 대해 기록합니다.
  • 계열에서 Sales(매출)는 489% 증가했지만 마지막 달에 감소하면서 하향 추세로 끝났습니다.
세 번째 문장은 기간별 측정값의 전체 실적에 대한 것입니다. 예를 들어 특정 기간 중에 매출이 증가했는지 감소했는지 다른 추세를 보였는지를 기록하는 문장이 있을 수 있습니다.
  • 백분율 기준으로 가장 큰 상승은 2014년 3월(+1,132%)에 발생했습니다. 그러나 절대값 기준으로 가장 큰 상승은 2014년 9월(+$53,868)에 발생했습니다.
네 번째 문장은 진행률 분석을 사용합니다. 이 문장은 기간 중의 측정값을 기준으로 백분율 기준과 절대값 기준을 모두 사용하여 최대 상승 및 감소에 대해 기록합니다.
  • 3개 계열 중에서 가장 강력한 관계는 Corporate(회사)와 Home Office(재택 근무 사무실) 간의 관계였는데 보통의 긍정적인 상관 관계를 보임으로써 하나(Corporate)가 상승하면 다른 하나(Home Office)도 일반적으로 상승하거나 그 반대의 관계에 있음을 시사합니다.
이 문장은 상관 관계 인사이트입니다. 이 유형의 분석 인사이트는 데이터의 여러 계열 간의 주목할 만한 상관 관계에 대해 기록합니다.
  • Sales(매출)에는 약 12개월의 주기를 반복할 때마다 순환성이 발생했습니다. 또한 약 3개월마다 반복된 더 짧은 주기의 패턴도 보였습니다.
  • Sales(매출)는 2014년 11월에 $78,629로 상승하면서 2014년 10월($31,453)과 2015년 2월($11,951) 사이에 큰 폭의 양의 피크를 보였습니다.
이 문장은 세그먼트 인사이트입니다. 이 유형의 분석 인사이트는 시간대별로 주목할 만한 증가 및 감소에 대해 기록합니다.
  • 계열의 전체 선형 추세는 월별 $902에서 상승했고 계열 중의 절대 변경은 $42,394였습니다. 다음 한 달간 이 추세가 계속되면 매출은 약 $69,958가 될 것으로 예측됩니다.
이 문장은 추세선 인사이트입니다. 이 유형의 인사이트는 특정 비율의 신뢰도에 따른 추세와 데이터의 적합성에 대해 기록하며 추세선을 사용하면 기록 추세를 기준으로 예측을 생성할 수 있습니다.

불연속형 스토리에 대한 분석 이해

불연속형 스토리를 사용하면 값을 비교하고 데이터의 분포를 이해할 수 있습니다. 따라서 불연속형 스토리는 데이터 전체의 분포, 평균, 합계 및 그룹화 또는 클러스터에 대해 기록합니다.

불연속형 스토리에 대한 다음 예제는 제품별 매출에 대한 것입니다.

제품별 매출에 대한 텍스트 인사이트가 포함된 예제 스토리 이 이미지의 텍스트는 다음 표에 전사되었습니다.

예제 스토리스토리 분류
  • Total Sales(총 매출)는 17개 제품 전체에서 $230만입니다.
첫 번째 문장은 측정값의 전체 값을 계산합니다.
  • $230만의 Sales(매출)는 다음에서 비롯되었습니다. Phones(전화) $330,007, Chairs(의자) $328,449, Storage(보관함) $223,844.
두 번째 문장은 차원 동인에 대해 기록합니다. 이 예제에서 차원 동인은 총 매출에 대한 기여도가 가장 높은 제품입니다.
  • 평균인 $135,129가 중앙값인 $114,880보다 크기 때문에 분포는 양적으로 왜곡되었습니다.
  • 17개 제품 중 8개(47%)가 총 매출의 78%를 나타내므로 매출은 비교적 집중되어 있습니다.
세 번째와 네 번째 문장은 데이터의 분포를 분석합니다. 이 문장은 평균, 중앙값, 데이터 집중도(있는 경우) 및 데이터의 왜도를 분석합니다. 따라서 그룹화된 변수의 상호 균형을 식별하는 데 도움이 됩니다.
  • 상위 2개 제품은 전체 매출의 1/4 이상(29%)을 차지합니다.
이 문장은 클러스터링을 사용하여 그룹화할 수 있는 측정값에 대해 기록합니다. 따라서 데이터에서 두드러지는 고유 그룹이 있는지 여부를 식별하는 데 도움이 됩니다.
  • Phones(전화) ($330,007)는 17개 제품 평균보다 2배 넘게 큽니다.
마지막 문장은 주목할 만한 이상값에 대해 기록합니다.

분산형 차트 스토리에 대한 분석 이해

분산형 차트 스토리 유형은 측정값 2개의 관계를 이해하기에 가장 적합하기 때문에 분산형 차트 스토리에는 2~3개의 측정값이 필요합니다. 분산형 차트 분석은 측정값 2개의 관계(회귀)에 대해 기록하며 데이터 내에 그룹(클러스터)이 있는 경우 해당 그룹에 대해 기록합니다.

분산형 차트 스토리의 다음 예제는 차원 전체의 수익 및 매출에 대한 것입니다.

수익 및 매출에 대한 텍스트 인사이트가 포함된 예제 스토리 이 이미지의 텍스트는 다음 표에 전사되었습니다.

예제 스토리스토리 분류
  • 제공된 데이터에 따르면 수량이 증가하면 수익이 증가했고 매출이 증가했습니다. 구체적으로 수량이 1 증가하면 매출이 $49.55 증가했고 수익이 $1.00 증가하면 매출이 $1.20 증가했습니다.
  • 이 일반적인 관계에서 벗어난 고객은 소수이므로 양호한 적합성을 나타냅니다.
처음 2개 문장은 회귀 분석을 기반으로 합니다. 회귀는 한 측정값이 다른 측정값에 미치는 영향을 보여줍니다. 첫 문장에서 이 스토리는 수익과 매출 간의 관계를 식별했습니다.
  • 유사한 수익, 수량 및 매출 값의 그룹으로 구성하면 한 그룹이 눈에 띕니다. 수익 값이 -$6,626 ~ $1,488이고, 수량이 2 ~ 122이며 매출이 $4.83 ~ $5,690인 고객은 651명입니다.
세 번째 문장은 클러스터링에서 도출되었습니다. 클러스터링 분석은 데이터의 모든 변수에서 핵심 그룹 또는 클러스터를 식별하려고 합니다.
  • Tamara Chand, Raymond BuchSanjit Chand는 수익 및 매출 값이 특히 높은 이상값입니다. Sean Miller는 수익이 낮고 매출 값이 높은 것으로 나타났습니다.
네 번째 문장은 평균보다 크게 높거나 낮은 이상값에 대해 기록합니다.
  • 수익의 최소값은 -$6,626(Cindy Stewart)이고 최대값은 $8,981(Tamara Chand)입니다. 차이는 $15,608입니다. 고객별 평균 수익은 $361이고 중앙값은 $228입니다.
  • 수량의 최소값은 2(Anthony O'Donnell)이고 최대값은 150(Jonathan Doherty)입니다. 차이는 148입니다. 고객별 평균 수량은 47.76이고 중앙값은 44입니다.
  • 매출 분포의 범위는 $4.83(Thais Sissman)에서 $25,043(Sean Miller)입니다. 차이는 $25,038입니다. 고객별 평균 매출은 $2,897이고 중앙값은 $2,256입니다.
분산형 차트 스토리의 나머지 문장은 범위와 평균 분석을 사용하여 인사이트를 기록합니다.

전체 대비 비율 스토리에 대한 분석 이해

전체 대비 비율 스토리 유형은 차원 또는 측정값이 전체에서 나타내는 부분을 이해하기에 가장 적합합니다.

전체 대비 비율 스토리에 대한 다음 예제는 세그먼트별 매출에 대한 것입니다.

세그먼트별 매출에 대한 텍스트 인사이트가 포함된 예제 스토리 이 이미지의 텍스트는 다음 표에 전사되었습니다.

예제 스토리스토리 분류
  • Total SUM(Sales(매출))은 3개 엔터티 전체에서 230만입니다.

첫 번째 문장은 측정값의 전체 값을 계산합니다.
  • 230만의 SUM(Sales(매출))은 Consumer(소비자) 120만, Corporate(회사) 706,146 및 Home Office(재택 근무 사무실) 429,653에서 비롯되었습니다.

두 번째 문장은 동인에 대해 기록합니다. 이 예제에서 동인은 총 매출에 대한 기여도가 가장 높은 세그먼트입니다.
  • 최소값은 429,653 (Home Office)이고 최대값은 120만(Consumer)이며 차이는 731,748로 평균 765,734입니다.
마지막 문장은 데이터의 분포를 분석합니다.