생성된 마크가 있는 예측 모델링
얼마 동안 Tableau를 사용했다면 "데이터 고밀도화"라는 말을 들어보셨을 것입니다. 이것은 마크가 기초 데이터 원본의 레코드에서 지원되지 않더라도 Tableau에서 마크를 생성하고 뷰에 추가하는 프로세스를 나타냅니다. 날짜 축을 확장할 때 또는 예측 모델링 함수를 사용하는 경우 예측을 표시하기 위해 이 프로세스를 수행할 수 있습니다.
자세한 내용: Data Plus Science에서 데이터 고밀도화에 대한 블로그 게시물을 참조하십시오.
누락된 값에 대한 예측 계산
예를 들어 미래 날짜에 대한 예측을 추가하고 싶을 수 있습니다. 기본적으로 Tableau에서 누락된 값은 표시되지 않지만 다음과 같이 마크를 생성할 수 있습니다.
날짜 또는 구간차원 머리글을 마우스 오른쪽 단추로 클릭(Mac의 경우 Control 클릭)합니다.
누락된 값 표시를 선택합니다.
하지만 이것만으로는 생성된 마크에 대한 예측을 수행할 수 없습니다. 생성된 마크에 대해 계산을 수행하려고 하면 예측 계산인지 여부와 관계없이 Tableau가 null 값을 반환합니다. 이러한 마크는 존재하지 않는 누락된 값을 기반으로 하기 때문에 이것은 예상된 동작입니다.
이러한 누락된 값에서 예측을 수행하려면 상단의 분석 메뉴를 연 다음 누락된 값에서 속성 유추를 선택합니다.
생성된 마크에 대한 예측의 예
이제 이 동작을 자세히 살펴보겠습니다. 누락된 값 표시 및 누락된 값에서 속성 유추 설정이 둘 중 하나 또는 둘 모두가 켜져 있는지 여부에 따라 비주얼리제이션에 미치는 영향을 보여주는 세 가지 다른 그림을 비교해보겠습니다. 이 예제를 따라하려면 Tableau Public에서 누락된 값에 대한 예측(영문) 통합 문서를 다운로드하십시오.
ATTR(DAY([Order Date]))을 예측자로 사용하여 예측을 포함했습니다. 이것이 데이터에 대한 최선의 예측자는 아니지만(그리고 부적절한 예측을 생성하지만), 이 문서의 목적을 고려하면 누락된 값에서 속성 유추를 잘 설명합니다.
각 비주얼리제이션에는 아래에 설명된 대로 행 선반에 동일한 네 가지 측정값이 포함됩니다.
- 행 1:
SUM([Profit])
- 행 2:
RUNNING_SUM(SUM([Profit]))
- 행 3:
ATTR(DAY([Order Date]))
- 행 4:
MODEL_QUANTILE(0.5, SUM([Profit]),ATTR(DAY([Order Date])))
그림 1
위 이미지에서 누락된 값 표시 및 누락된 값에서 속성 유추가 모두 해제되어 있으며, 이것이 Tableau의 기본 설정입니다.
누락된 값에서 속성 유추가 설정되어 있고 누락된 값 표시가 해제되어 있는 경우 동일한 비주얼리제이션이 표시됩니다. 이것은 누락된 값에서 속성 유추가 작동하려면 누락된 값 표시가 설정되어 있어야 하기 때문입니다.
그림 2
위 이미지에서 누락된 값 표시가 설정되어 있고 누락된 값에서 속성 유추가 해제되어 있습니다. 기본 설정은 누락된 값 표시가 설정되어 있어도 누락된 값에서 속성 유추가 해제되어 있습니다.
이 상황에서는 누락된 값(행 3)에 대해 DAY([Order Date])의 ATTR 값을 계산하지 않습니다. 고밀도화된 날짜에 대한 예측을 생성하지만 행 3에 표시된 대로 실제 ATTR(DAY([Order Date]))를 유추할 수 없기 때문에 모든 누락된 날짜에 대해 예측이 동일합니다. 실제로 이러한 마크는 DAY([Order Date])가 null인 것처럼 계산됩니다.
그림 3
이 이미지에서는 누락된 값 표시 및 누락된 값에서 속성 유추가 모두 설정되어 있으며 누락된 값에서 속성 유추 설정이 작동하는 것을 보여줍니다.
여기에서 볼 수 있는 것처럼, ATTR(DAY([Order Date]))(행 3)를 유추할 수 있기 때문에 행 4의 예측에 이 값을 사용할 수 있으며, 멋지고 부드러운 예측 곡선이 반환됩니다.