데이터 설명의 설명 유형

비주얼리제이션 또는 대시보드에서 새 마크를 선택하고 데이터 설명을 실행할 때마다 Tableau는 해당 마크와 통합 문서의 기초 데이터를 고려하여 새로운 통계 분석을 실행합니다. 가능한 설명은 데이터 가이드 패널의 확장 가능한 섹션에 표시됩니다. 데이터 설명을 통해 설명이 분석 및 평가되는 방식에 대한 자세한 내용은 데이터 설명 작동 방식을 참조하십시오.

기초값 탐색

이 섹션에는 설명될 수 있는 각 측정값에 대한 설명이 나열됩니다(이를 대상 측정값이라고 함). 여기에 나열된 각 설명은 분석된 마크에서 테스트를 거친 대상 측정값의 관계에 대해 설명합니다. 데이터에 대한 현실적이고 실무적인 이해를 바탕으로 데이터 설명에서 찾은 관계가 의미 있고 탐구 가치가 있는지 판단하십시오.

이 예에서는 Trip Distance(주행 거리)가 대상 측정값입니다.

기초 특성

마크 특성 설명은 뷰에서 마크의 기초 레코드가 설명된 측정값의 집계 값에 어떤 영향을 줄 수 있는지를 설명합니다. 마크 특성에는 극한 값, Null 값, 레코드 수 또는 마크의 평균 값이 포함될 수 있습니다.

참고: 설명에 사용되는 일반적인 용어의 정의는 설명의 용어 및 개념(링크가 새 창에서 열림)을 참조하십시오.

극한 값

이 설명 유형은 하나 이상의 레코드에 대부분의 레코드보다 훨씬 높거나 낮은 값이 있는 경우를 나타냅니다. 설명이 모델에서 지원되는 경우, 극한 값이 분석된 마크의 대상 측정값에 영향을 미치고 있음을 나타냅니다.

마크에 극한 값이 있는 경우 이상값이라는 의미이거나 뷰에서 해당 레코드를 제외해야 한다는 의미는 아닙니다. 선택은 분석에 따라 결정됩니다. 설명은 단지 마크에 극한 값이 있다는 것을 나타냅니다. 예를 들어 바나나 가격이 10센트가 아니라 10달러인 경우 레코드의 잘못 입력된 값을 나타낼 수 있습니다. 또는 특정 영업 사원의 훌륭한 분기 실적을 나타내는 것일 수 있습니다.

참고: 이 설명은 게시된 통합 문서의 보기 모드에서 볼 수 있도록 작성자가 설정해야 합니다. 자세한 내용은 데이터 설명에 대한 액세스 제어를 참조하십시오.

이 설명이 보여주는 내용:

  • 분석된 마크의 기초 레코드 수
  • 대상 측정값에 기여하는 극한 값
  • 마크의 값 분포
  • 각 분포 값에 해당하는 레코드 세부 정보

탐색 옵션:

  • 차트의 원 위를 마우스오버하면 해당 값이 표시됩니다.
  • 세부 정보 목록 아래의 왼쪽 또는 오른쪽 화살표를 선택하여 레코드 세부 정보를 스크롤합니다.
  • 사용 가능한 경우 전체 데이터 보기를 선택한 다음 전체 데이터 탭을 선택하여 테이블의 모든 레코드를 표시합니다.
  • 더 큰 버전의 비주얼리제이션을 보려면 열기 아이콘을 선택합니다.

분석을 위한 다음 단계:

  • 레코드 수가 적으면 이러한 값을 극한 값과 비교하여 검토합니다.
  • 극한 값이 다른 레코드 값보다 크게 높거나 낮은 경우 해당 값을 제외하고 분석된 마크의 값이 어떻게 변경되는지 고려하십시오.
  • 극한 값이 있는 데이터와 없는 데이터를 고려하면서 데이터에 대한 실용적인 지식을 적용할 수 있는 기회로 활용하십시오.

 

이 예에서, 463시간 임대라는 한 개의 극한 값이 예상된 합계보다 높은 총 임대 613시간의 원인이 됩니다.

이 높은 값의 가능한 이유는 누군가 자전거를 반납할 때 거치대에 꽂는 것을 잊어버렸기 때문일 수 있습니다. 이 경우 작성자는 향후 분석을 위해 이 값을 제외하려 할 수 있습니다.

 

차이 시각화

이 섹션이 보여주는 내용:

  • 극한 값이 제외될 때 분석된 마크 값이 변경되는 방식

 

 

 

 

 

 

 

탐색 옵션:

  • 더 큰 버전의 비주얼리제이션을 보려면 열기 아이콘을 선택합니다.
  • 극한 값을 포함할 때와 제외할 때의 차이점을 살펴보십시오.
  • 작성자는 뷰를 새 시트로 열고 필터를 적용하여 극한 값을 제외할 수 있습니다.

분석을 위한 다음 단계:

  • 극한 값이 다른 레코드 값보다 크게 높거나 낮은 경우 해당 값을 제외하고 분석된 마크의 값이 어떻게 변경되는지 확인하십시오.
  • 극한 값이 있는 데이터와 없는 데이터를 고려하면서 데이터에 대한 실용적인 지식을 적용할 수 있는 기회로 활용하십시오.
 

이 예에서 483의 극한 값이 제외되면 분석된 마크가 뷰의 다른 마크에 비해 더 이상 높지 않습니다. 다른 마크가 이제 눈에 띕니다. 작성자가 다른 마크를 둘러보면서 다른 위치에서 왜 자전거 대여에 더 많은 시간이 걸리는지 생각해 볼 수도 있습니다.

Null 값

Null 값 설명 유형은 마크의 누락 데이터가 예상보다 많은 상황에서 표시됩니다. 이 유형은 null인 대상 측정값의 비율과 해당 측정값의 집계 값에 null 값이 미치는 영향을 나타냅니다.

이 설명이 보여주는 내용:

  • 분석된 마크에 대한 대상 측정값에서 null인 값의 비율(파란색 원)

탐색 옵션:

  • 분산형 차트의 각 원 위로 마우스오버하면 세부 정보가 표시됩니다.
  • 차트를 더 보려면 스크롤합니다.
  • 더 큰 버전의 비주얼리제이션을 보려면 열기 아이콘을 선택합니다.

분석을 위한 다음 단계:

  • 필요한 경우 추가 분석을 위해 마크의 null 값을 제외합니다.
 

이 예에서 대상 측정값에서 null 값의 백분율은 파란색 원으로 표시되어 있습니다.

레코드 수

이 설명 유형은 기초 레코드 수가 합계와 상관 관계가 있는 시기를 설명합니다. 분석 결과, 마크에 집계되는 레코드 수와 마크의 실제 값 간의 관계가 발견됩니다.

명백한 것처럼 보일 수도 있지만 이 설명 유형을 사용하면 마크 값이 해당 레코드에 있는 값 규모의 영향을 받는지, 아니면 단순히 분석된 마크에 있는 레코드 수의 영향을 받는지를 확인할 수 있습니다.

이 설명이 보여주는 내용:

  • 분석된 마크(진한 파란색 막대)에 대한 대상 측정값의 레코드 수
  • 원본 비주얼리제이션의 다른 마크에 대한 대상 측정값의 레코드 수(연한 파란색 막대)

탐색 옵션:

  • 각 막대를 마우스오버하면 세부 정보가 표시됩니다.
  • 차트를 더 보려면 스크롤합니다.
  • 더 큰 버전의 비주얼리제이션을 보려면 열기 아이콘을 선택합니다.

분석을 위한 다음 단계:

  • 개별 레코드 값이 낮은지 높은지 또는 분석된 마크의 레코드 수가 적은지 많은지를 비교합니다.
  • 많은 수의 레코드에 놀랄 수 있는 경우 작성자는 데이터를 정규화해야 할 수 있습니다.
 

이 예에서는 Trip Distance(주행 거리)에 대한 레코드 수가 원래 비주얼리제이션의 차원을 나타내는 Ride(승차) 월의 각 값에 대해 나열됩니다. 8월에 총 주행 거리 값이 가장 높습니다.

8월에 더 많은 승차가 발생했기 때문에 8월의 주행 거리가 가장 높은 것인지, 아니면 일부 승차 거리가 길어서 주행 거리가 가장 높은 것인지 알아볼 수 있습니다.

마크의 평균값

이 설명 유형은 측정값의 평균이 합계와 상관 관계가 있는 시기를 설명합니다. 평균값이 낮은지 높은지 또는 레코드 수가 적은지 많은지를 비교합니다.

이 설명이 보여주는 내용:

  • 원본 비주얼리제이션에 사용된 차원의 각 값에 대한 대상 측정값의 평균입니다.

탐색 옵션:

  • 각 막대를 마우스오버하면 세부 정보가 표시됩니다.
  • 차트를 더 보려면 스크롤합니다.
  • 더 큰 버전의 비주얼리제이션을 보려면 열기 아이콘을 선택합니다.

분석을 위한 다음 단계:

  • 평균값이 낮은지 높은지 또는 레코드 수가 적은지 많은지를 비교합니다. 예를 들어, 수익이 높은 이유가 많은 수의 상품을 팔았기 때문인지 아니면 비싼 상품을 팔았기 때문인지를 평가할 수 있습니다.
  • 분석된 마크가 평균값을 크게 상회하거나 하회하는 이유를 알아볼 수 있습니다.

 

 

이 예에서 8월의 평균 주행 거리는 대부분의 달보다 현저히 높거나 낮지 않습니다. 이것은 8월의 주행 거리가 높은 이유가 사람들의 주행 거리가 길었다기보다는 8월에 더 많이 승차했다는 것을 의미합니다.

 

기여 단일 값

이 설명을 사용하여 분석된 마크를 구성하는 레코드 값의 구성을 이해할 수 있습니다.

이 설명 유형은 시각화되지 않은 차원의 단일 값이 분석된 마크의 집계 값에 영향을 줄 수 있는 경우를 식별합니다. 시각화되지 않은 차원은 데이터 원본에 존재하지만 현재 뷰에서 사용되고 있지 않은 차원입니다.

이 설명은 차원의 모든 기초 레코드에 같은 값이 있는 경우를 나타내거나, 분석된 마크에 대해 동일한 단일 값이 있는 레코드가 여러 개 있거나 몇 개만 있어서 차원 값이 눈에 띄는 경우를 나타냅니다.

참고: 설명에 사용되는 일반적인 용어의 정의는 설명의 용어 및 개념(링크가 새 창에서 열림)을 참조하십시오.

이 설명이 보여주는 내용:
  • 원본 비주얼리제이션의 분석된 마크(파란색 막대)와 모든 마크(회색 막대)에 대한 단일 차원 값의 레코드 수 백분율
  • 원본 비주얼리제이션의 분석된 마크(파란색 막대)와 모든 마크(회색 막대)에 대한 다른 모든 차원 값의 레코드 수 백분율
  • 분석된 마크(파란색 막대)와 모든 마크(회색 막대)의 단일 차원 값에 대한 대상 측정값 평균
  • 원본 비주얼리제이션의 분석된 마크(파란색 막대)와 모든 마크(회색 막대)에 대한 다른 모든 차원 값의 대상 측정값 평균

탐색 옵션:

  • 각 막대를 마우스오버하면 세부 정보가 표시됩니다.
  • 더 큰 버전의 비주얼리제이션을 보려면 열기 아이콘을 선택합니다.

분석을 위한 다음 단계:

  • 이 설명을 사용하여 분석된 마크를 구성하는 레코드 값의 구성을 이해할 수 있습니다.
  • 작성자는 이 설명에 나타난 시각화되지 않은 차원을 탐색하기 위해 새로운 비주얼리제이션을 만들려 할 수 있습니다.
 

이 예에서 통계 분석을 통해 Back Bay(백베이) 역 근처에서 많이들 탄다는 것을 알 수 있습니다. Station Neighborhood(역 주변)는 원본 비주얼리제이션의 기초 데이터에서 Trip Distance(주행 거리)와 일부 관계가 있는 시각화되지 않은 차원입니다.

 

최상위 기여자

이 설명을 사용하여 분석된 마크의 최대 비율을 구성하는 값을 볼 수 있습니다.

COUNT 집계의 경우 최상위 기여자는 레코드 수가 가장 많은 차원 값을 보여줍니다. SUM의 경우 이 설명은 부분합이 가장 큰 차원 값을 보여줍니다.

 

기여 차원

이 설명을 사용하여 분석된 마크를 구성하는 레코드 값의 구성을 이해할 수 있습니다.

이 설명 유형은 시각화되지 않은 차원의 분포가 분석된 마크의 집계 값에 영향을 줄 수 있음을 나타냅니다. 이 유형의 설명은 대상 측정값 합계, 개수 및 평균에 사용됩니다. 시각화되지 않은 차원은 데이터 원본에 존재하지만 현재 뷰에서 사용되고 있지 않은 차원입니다.

참고: 설명에 사용되는 일반적인 용어의 정의는 설명의 용어 및 개념(링크가 새 창에서 열림)을 참조하십시오.

이 설명이 보여주는 내용:
  • 원본 비주얼리제이션의 분석된 마크(파란색 막대)에 대한 모든 차원 값과 모든 마크(회색 막대)에 대한 모든 차원 값의 레코드 수 백분율
  • 분석된 마크(파란색 막대)의 모든 차원 값과 모든 마크(회색 막대)의 모든 차원 값에 대한 대상 측정값 평균

탐색 옵션:

  • 각 막대를 마우스오버하면 세부 정보가 표시됩니다.
  • 차트를 더 보려면 스크롤합니다.
  • 더 큰 버전의 비주얼리제이션을 보려면 열기 아이콘을 선택합니다.

분석을 위한 다음 단계:

  • 이 설명을 사용하여 분석된 마크를 구성하는 레코드 값의 구성을 이해할 수 있습니다.
  • 작성자는 이 설명에 나타난 시각화되지 않은 차원을 탐색하기 위해 새로운 비주얼리제이션을 만들려 할 수 있습니다.
 

이 예에서 통계 분석을 통해 마크 전체의 승차 횟수를 비교한 결과, South Station(사우스 스테이션)과 MIT 역에서 더 많이 타고 Charles Circle(찰스 서클)과 Kendall(켄들)에서 더 적게 탔다는 것을 알 수 있습니다.

Station Name(역 이름)은 원본 비주얼리제이션의 기초 데이터에서 Trip Distance(주행 거리)와 일부 관계가 있는 시각화되지 않은 차원입니다.

 

기여 측정값

이 설명 유형은 시각화되지 않은 측정값 평균이 분석된 마크의 집계 값에 영향을 줄 수 있음을 나타냅니다. 시각화되지 않은 측정값은 데이터 원본에 존재하지만 현재 뷰에서 사용되고 있지 않은 측정값입니다.

이 설명은 시각화되지 않은 측정값과 대상 측정값 간의 선형 또는 2차 관계를 나타낼 수 있습니다.

참고: 설명에 사용되는 일반적인 용어의 정의는 설명의 용어 및 개념(링크가 새 창에서 열림)을 참조하십시오.

이 설명이 보여주는 내용:
  • 뷰의 분석된 마크(파란색 원)와 모든 마크(회색 원)에 대한 대상 측정값의 합계와 시각화되지 않은 측정값의 평균 간의 관계
  • 시각화되지 않은 측정값의 평균값이 높거나 낮아서 대상 측정값의 합계가 높거나 낮은지 여부

탐색 옵션:

  • 각 원을 마우스오버하면 세부 정보가 표시됩니다.
  • 더 큰 버전의 비주얼리제이션을 보려면 열기 아이콘을 선택합니다.

분석을 위한 다음 단계:

  • 작성자는 이 설명에 나타난 시각화되지 않은 측정값을 탐색하기 위해 새로운 비주얼리제이션을 만들려 할 수 있습니다.
 

이 예에서 주행 거리가 높은 한 가지 가능한 이유는 대여한 평균 총 시간도 높기 때문입니다.

기타 항목 탐색

이 섹션에서는 분석된 마크가 고유하거나 비정상적인 가능한 이유를 보여 줍니다. 설명:

  • 이 마크의 값이 무엇이든 그 이유를 설명하지 마십시오.
  • 원본 비주얼리제이션의 측정값과 어떤 식으로든 관련이 없습니다.
  • 대상 측정값을 고려하지 마십시오.

기타 관심 차원

이 설명을 사용하여 분석된 마크를 구성하는 레코드 값의 구성을 이해할 수 있습니다.

분석된 마크에서 시각화되지 않은 차원의 분포는 뷰의 다른 모든 마크에 대한 값의 분포와 비교할 때 비정상적입니다. 시각화되지 않은 차원은 데이터 원본에 존재하지만 현재 뷰에서 사용되고 있지 않은 차원입니다.

참고: 설명에 사용되는 일반적인 용어의 정의는 설명의 용어 및 개념(링크가 새 창에서 열림)을 참조하십시오.

이 설명이 보여주는 내용:
  • 원본 비주얼리제이션의 분석된 마크(파란색 막대)에 대한 모든 차원 값과 모든 마크(회색 막대)에 대한 모든 차원 값의 레코드 수 백분율

탐색 옵션:

  • 각 막대를 마우스오버하면 세부 정보가 표시됩니다.
  • 차트를 더 보려면 스크롤합니다.
  • 더 큰 버전의 비주얼리제이션을 보려면 열기 아이콘을 선택합니다.

분석을 위한 다음 단계:

  • 이 설명을 사용하여 분석된 마크를 구성하는 레코드 값의 구성을 이해할 수 있습니다.
  • 작성자는 이 설명에 나타난 시각화되지 않은 차원을 탐색하기 위해 새로운 비주얼리제이션을 만들려 할 수 있습니다.
 

이 예에서는 높은 비율의 레코드가 흐린 날씨와 연관이 있습니다. 이 데이터는 Boston(보스턴)의 자전거 대여에 관한 데이터이고, 분석된 마크가 8월의 Trip Distance(주행 거리)이기 때문에 날씨가 일반적으로 따뜻하고 습하다고 가정할 수 있습니다. 사람들은 더위를 피하기 위해 흐린 날에 자전거를 더 자주 빌렸을지도 모릅니다. 또한 8월에 더 많은 흐린 날들이 있었을 수도 있습니다.

 

피드백을 제공해 주셔서 감사합니다!귀하의 피드백이 제출되었습니다. 감사합니다!