예측 설명
예측 설명 대화 상자는 Tableau에서 시각화에 대해 계산한 예측 모델을 설명합니다.
예측을 사용하도록 설정하면 분석 > 예측 > 예측 설명을 선택하여 이 대화 상자를 열 수 있습니다.
예측 설명 대화 상자의 정보는 읽기 전용이지만, 클립보드로 복사를 클릭한 다음 화면 내용을 문서에 붙여 넣을 수 있습니다.
예측 설명 대화 상자에는 두 개의 탭, 즉, 요약 탭과 모델 탭이 있습니다.
예측 설명 – 요약 탭
요약 탭에는 Tableau에서 만든 예측 모델과 Tableau가 데이터에서 발견한 일반 패턴에 대한 설명이 포함됩니다.
예측 작성을 위해 사용하는 옵션
이 섹션에는 Tableau에서 예측 작성을 위해 사용한 옵션이 요약되어 있습니다. 이러한 옵션은 Tableau에서 자동으로 선택되거나 예측 옵션 대화 상자에서 지정되었습니다.
시계열 - 시계열을 정의하는 데 사용되는 연속형 날짜 필드입니다. 이 값이 실제로 날짜가 아닌 경우도 있습니다. 뷰에 날짜가 없을 경우 예측을 참조하십시오.
측정값 - 값이 추정되는 측정값입니다.
미래 예측 - 예측의 길이 및 날짜 범위입니다.
예측 기준 - 예측 작성에 사용된 실제 데이터의 날짜 범위입니다.
마지막 무시 - 무시되는 실제 데이터의 끝 기간입니다. 이러한 기간에 대해 예측 데이터가 표시됩니다. 이 값은 예측 옵션 대화 상자의 마지막 무시 옵션에 의해 결정됩니다.
계절 패턴 - Tableau가 데이터에서 검색한 계절 주기의 길이입니다. 모든 예측에서 계절 주기가 검색되지 않은 경우는 없음입니다.
예측 요약 테이블
예측되는 각 측정값에 대해 예측을 설명하는 요약 테이블이 표시됩니다. 차원을 사용하여 뷰가 여러 패널로 나뉘는 경우 차원을 식별하는 열이 각 테이블에 삽입됩니다. 요약 예측 테이블의 필드는 다음과 같습니다.
초기 - 첫 번째 예측 기간의 값 및 예측 구간입니다.
초기에서 변경 - 첫 번째 예측과 마지막 예측의 차이로 요소를 추정합니다. 두 요소의 간격이 열 머리글에 표시됩니다. 값이 비율로 표시되는 경우 첫 번째 예측 기간에서 변경된 비율이 이 필드에 표시됩니다.
계절 효과 - 이 필드는 계절적 변동이 있는 것으로 식별된 모델, 즉 시간 경과에 따른 반복 변형 패턴이 있는 모델에 대해 표시됩니다. 실제 값과 예측 값이 결합된 시계열로 지난 전체 계절 주기에 대한 계절 구성 요소의 상한/하한 값을 표시합니다. 계절 구성 요소는 추세의 편차를 나타내므로 0을 기준으로 달라지며 계절 전체의 합계는 0이 됩니다.
기여 - 추세와 계절적 변동이 예측에 기여하는 정도입니다. 이 값은 항상 비율로 표시되며 합산하면 100%가 됩니다.
품질—예측이 실제 데이터와 얼마나 일치하는지를 나타냅니다. 가능한 값은 좋음, 양호 및 나쁨입니다. Naïve 예측은 다음 기간의 값이 현재 기간의 값과 동일할 것으로 추정하는 예측입니다. 품질은 Naïve 예측에 상대적으로 표시됩니다. 즉, 양호는 예측이 Naïve 예측보다 오차가 적을 가능성이 높은 경우이고, 좋음은 예측의 오차가 절반 미만인 경우이고, 나쁨은 예측의 오차가 더 많은 경우입니다.
예측 설명 – 모델 탭
모델 탭은 예측에 사용된 Holt-Winters 지수 평활법 모델에 대한 평활 계수 값과 더 완전한 통계를 제공합니다. 예측되는 각 측정값에 대해 Tableau가 측정값에 대해 만든 예측 모델을 설명하는 테이블이 표시됩니다. 차원을 사용하여 뷰가 여러 패널로 나뉘는 경우 차원을 식별하는 열이 각 테이블에 삽입됩니다. 테이블은 다음 섹션으로 구성됩니다.
모델
수준, 추세 또는 계절 구성 요소가 예측을 생성하는 데 사용된 모델의 일부인지 여부를 지정합니다. 각 구성 요소에 대한 값은 다음 중 하나입니다.
없음 - 구성 요소가 모델에 없습니다.
가법 - 구성 요소가 있으며 전체 예측 값을 만들기 위해 다른 구성 요소에 추가됩니다.
승법 - 구성 요소가 있으며 전체 예측 값을 만들기 위해 다른 구성 요소와 곱해집니다.
품질 메트릭
이 값 집합은 모델 품질에 대한 통계 정보를 제공합니다.
값 | 정의 |
RMSE: 평균 제곱근 오차 | |
MAE: 평균 절대 오차 | |
MASE: 평균 절대 눈금 오차 MASE는 Naive OSAFE(One Step Ahead Forecast Error)의 크기와 비교한 오차의 크기를 비율로 측정합니다. Naive 예측은 오늘 값이 내일 동일한 값이 된다고 가정합니다. 따라서 MASE 0.5는 사용자의 예측에서 Naive 예측 오류의 1/2이 발생할 가능성이 높다고 가정합니다. 이는 Naive 예측보다 낫지 않은 1.0보다는 낫습니다. 이는 모든 값에 대해 정의되고 오차에 동일한 가중치를 두는 정규화 통계이므로 서로 다른 예측 방법의 품질을 비교하는 뛰어난 메트릭입니다. 일반적인 MAPE 메트릭과 비교할 때 MASE의 장점은 MASE의 경우 0이 포함된 시계열에 대해 정의되지만 MAPE는 그렇지 않다는 점입니다. 또한 MASE는 오차에 동일한 가중치를 두지만 MAPE는 양 및/또는 극한의 오차에 더 많은 가중치를 둡니다. | |
MAPE: 평균 절대 비율 오차 MAPE는 사용자 데이터의 크기와 비교한 오차의 크기를 비율로 측정합니다. 따라서 MAPE 20%는 MAPE 60%보다 양호합니다. 오차는 모델이 측정하는 응답 값과 데이터의 각 설명 값에 대한 실제 응답 값의 차이입니다. 이는 정규화 통계이므로 Tableau에서 계산된 서로 다른 모델의 품질을 비교하는 데 사용될 수 있습니다. 그러나 이는 일부 오차에 다른 오차보다 더 많은 가중치를 두기 때문에 일부 비교에서 신뢰할 수 없습니다. 또한 이는 값이 0인 데이터에 대해 정의되지 않습니다. | |
AIC: Akaike 정보 기준 AIC는 Hirotugu Akaike가 개발한 모델 품질 측정값으로서 복잡한 모델에 점수를 감하는 방식으로 과적합을 방지합니다. 이 정의에서 k는 초기 상태를 포함하여 예측 매개 변수의 번호이고 SSE는 오차제곱합입니다. |
앞의 정의에서 변수는 다음과 같습니다.
변수 | 의미 |
t | 시계열의 기간 인덱스입니다. |
n | 시계열 길이입니다. |
m | 계절/주기의 기간입니다. |
A(t) | 기간 t에서의 시계열 실제 값입니다. |
F(t) | 기간 t에서의 적합 또는 예측 값입니다. |
나머지: e(t) = F(t)-A(t)
평활 계수
평활 계수는 데이터의 수준, 추세 또는 계절 구성 요소에 대한 진화 속도에 따라 샘플 내 1 시차 앞 예측 오차를 최소화하도록 최적화되어 오래된 값보다 최근 데이터 값에 더 많은 가중치를 둡니다. 알파는 수준 평활 계수이고, 베타는 추세 평활 계수이고, 감마는 계절 평활 계수입니다. 평활 계수가 1.00에 가까울수록 평활이 적게 수행되어 구성 요소를 빠르게 변경할 수 있고 최신 데이터에 대한 신뢰도가 높아집니다. 평활 계수가 0.00에 가까울수록 평활이 많이 수행되어 구성 요소를 점진적으로 변경할 수 있고 최신 데이터에 대한 신뢰도가 낮아집니다.