예 - 예측 모델링 함수로 여성의 기대 수명 탐색
이 예에서는 Tableau와 함께 제공되는 세계 지표라는 저장된 데이터 원본을 사용합니다. MODEL_QUANTILE 및 MODEL_PERCENTILE 예측 모델링 함수를 사용하여 1인당 의료비 지출, 여성 기대 수명, 출생률 간의 관계를 탐색합니다.
각 국가의 의료비 지출을 여성 기대 수명과 비교하는 비주얼리제이션부터 시작하겠습니다. 미리 작성된 뷰 및 대시보드를 사용하고 액세스하거나 솔루션을 보려면 Tableau Public에서 여성 기대 수명 예측 모델링(영문) 통합 문서를 다운로드하십시오.
MODEL_PERCENTILE 사용
먼저 모든 표시된 마크에 대해 기대 수명과 의료비를 평가할 것입니다. 이렇게 하면 Tableau가 해당 마크에서 모델을 작성하고 모델 내에서 각각에 대한 백분위수를 반환할 수 있습니다.
1단계: 예측 계산 만들기
Tableau Server 또는 Tableau Cloud가 있고 Tableau Desktop 대신 웹에서 작성하려는 경우 통합 문서를 Tableau Server에 게시하고 통합 문서를 클릭하고 통합 문서를 선택한 다음 동작에서 통합 문서 편집을 선택합니다.
통합 문서가 열리면 여러 시트가 있다는 것을 알 수 있습니다. 이러한 시트 사용하여 뷰를 작성합니다.
스타터 통합 문서에서 Percentile Starter 시트를 클릭합니다.
상단의 분석 메뉴를 연 다음 계산된 필드 만들기를 선택합니다.
계산 에디터에서 다음 작업을 수행합니다.
계산 이름을 Percentile Expectancy vs Spending으로 지정합니다.
다음 수식을 입력합니다.
MODEL_PERCENTILE(AVG([Life Expectancy Female]), LOG(MEDIAN([Health Exp/Capita])))
확인을 클릭합니다.
이제 예측 계산이 데이터 패널에서 계산된 필드로 추가됩니다.
이 계산에서는 평균 기대 수명을 대상 식으로 사용하고 평균 의료비를 예측자로 사용합니다. 이 경우 의료비 지출 축과 예측자에 대해 로그 변환을 사용했습니다.
2단계: 뷰에 예측 계산 추가
위의 비주얼리제이션에서 2012년으로 필터링된 각 국가의 여성 기대 수명 대비 의료비 지출을 확인할 수 있습니다.
이제 뷰에 MODEL_PERCENTILE 계산을 추가하고 어떤 심층 정보를 얻을 수 있는지 살펴보겠습니다.
Percentile Expectancy vs Spending을 마크 카드의 색상으로 끌어옵니다.
알약 모양의 드롭다운 화살표를 클릭하고 계산 도구 > 국가/지역을 선택합니다.
마크 카드의 색상을 클릭한 다음 색상 편집을 클릭합니다.
색상표에서 주황색-파란색 다중을 선택합니다.
단계별 색상 확인란을 선택합니다.
반전 확인란을 선택합니다.
확인을 클릭합니다.
지출 수준을 기반으로 예상되는 값보다 의료 기대치가 높은 국가와 낮은 국가의 분포를 확인할 수 있습니다. 일반적으로 진한 빨간색 마크는 의료비 지출에 비해 기대 수명이 높음을 나타내고, 진한 파란색은 의료비 지출에 비해 기대 수명이 낮음을 의미하며, 회색은 의료비 지출 수준을 기반으로 모델에서 예상하는 기대 수명에 근접함을 나타냅니다.
3단계: 색상별로 결과 그룹화
분석을 단순화하기 위해 새 계산 내에서 예측 계산을 사용하여 결과를 그룹화하겠습니다. 90번째 백분위수 위에 있는 마크와 10번째 백분위 수 아래에 있는 마크가 함께 그룹화되고, 80~90번째 백분위수 범위 및 10~20번째 백분위수 범위의 마크가 함께 그룹화되는 방식으로 그룹을 만들 것입니다. 또한 null 값이 있는 마크를 하이라이트하고 나중에 다른 예측 모델링 함수인 MODEL_QUANTILE을 사용하여 문제를 해결할 것입니다.
계산 에디터에서 다음 작업을 수행합니다.
계산 이름을 Percentile by Color로 지정합니다.
다음 수식을 입력합니다.
IF
ISNULL([Percentile Expectancy vs Spending])
THEN "Null"
ELSEIF [Percentile Expectancy vs Spending] >=0.9 OR
[Percentile Expectancy vs Spending] <=0.1
THEN "<10th & >90th percentile"
ELSEIF [Percentile Expectancy vs Spending] >=0.8 OR
[Percentile Expectancy vs Spending] <=0.2
THEN "<20th & >80th percentile"
ELSEIF [Percentile Expectancy vs Spending] >=0.7 OR
[Percentile Expectancy vs Spending] <=0.3
THEN "<30th & >70th percentile"
ELSEIF [Percentile Expectancy vs Spending] >=0.6 OR
[Percentile Expectancy vs Spending] <=0.4
THEN "<40th & >60th percentile"
ELSE "50th percentile +-10"
END새 계산을 마크 카드의 색상에 추가합니다.
알약 모양의 드롭다운 화살표를 클릭하고 계산 도구 > 국가/지역을 선택합니다.
마크 카드의 색상을 클릭한 다음 색상 편집을 클릭합니다.
추세를 더 잘 볼 수 있도록 색상을 조정합니다. 이 경우 신호등 색상표를 사용하고 Null에 대해 회색을 사용합니다.
확인을 클릭합니다.
모퉁이에 있는 주황색 표시를 보면 미국이 81세의 기대 수명 동안 여성 1인당 8,895달러를 지출하고 있음을 알 수 있습니다. X축을 따라 왼쪽으로 이동하면 다른 국가는 지출이 더 적지만 기대 수명이 동일하다는 것을 알 수 있습니다.
이 모델은 미국이 모델의 예상 범위의 상단에 가까운 각 지점에서 관계의 강도를 평가합니다.
4단계: 기대 수명과 출생률 비교
다음으로 여성 기대 수명과 출생률을 비교하는 비주얼리제이션을 살펴보겠습니다. 출생률과 여성 기대 수명 사이에는 음의 상관 관계가 있습니다. 그러나 이것이 높은 출산율이 여성 기대 수명을 낮추는 요인이라는 의미는 아닙니다. 이 데이터 뷰에서 볼 수 없지만 출생률과 여성 기대 수명 모두에 영향을 미치는 추가 요인이 있을 수 있습니다. 그러나 모델을 추가하고 의료비가 주어졌을 때 모델이 여성 기대 수명이 더 높거나 낮을 것으로 예상하는 국가를 살펴보겠습니다.
Birth Rate 시트에서 Percentile by Color 예측 계산을 마크 카드의 색상에 추가하여 뷰로 가져옵니다.
알약 모양의 드롭다운 화살표를 클릭하고 계산 도구 > 국가/지역을 선택합니다.
마크 카드의 색상을 클릭한 다음 색상 편집을 클릭합니다. 신호등 팔레트를 사용하고 Null에 회색을 사용하여 이전과 같이 색상을 편집합니다.
확인을 클릭합니다.
이제 데이터가 훨씬 더 분산되어 있습니다. 오른쪽 맨 아래의 빨간색 구간은 기대 수명이 가장 낮지만 출생률이 가장 높고 기대 수명 대비 의료비 지출이 낮은 곳입니다. 알바니아 및 아르메니아와 관련된 왼쪽 상단 사분면에 있는 두 빨간색 마크를 보면 두 국가 모두 여성의 기대 수명이 높고 출산율이 낮으며 의료비가 낮다는 것을 알 수 있습니다.
여기에서 볼 수 있는 것처럼, MODEL_PERCENTILE을 사용하여 이 두 국가가 이상값임을 식별할 수 있었습니다. 두 국가 모두 의료비 지출이 상대적으로 낮더라도 출생률의 맥락에서 기대 수명이 상대적으로 높습니다.
이제 다른 예측 모델링 함수인 MODEL_QUANTILE을 사용하여 분석을 계속하는 방법을 살펴보겠습니다.
MODEL_QUANTILE 사용
MODEL_QUANTILE은 대상 백분위 수, 대상 식 및 예측자가 주어질 경우 수치 예측을 생성하는 데 사용됩니다. 이 함수는 MODEL_PERCENTILE의 역입니다.
결과에 여러 개의 null 값이 있으며, 이것은 일부 국가에 의료비 데이터가 없음을 의미합니다. MODEL_QUANTILE을 사용하여 이러한 누락된 값을 추정합니다.
1단계: 예측 계산 만들기
여기에서는 다음 계산으로 작업했습니다.
MODEL_PERCENTILE(AVG([Life Expectancy Female]), LOG(MEDIAN([Health Exp/Capita])))
첫째, 여성 기대 수명을 기준으로 의료비 지출을 예측하기 위해 이 함수를 반전하려고 합니다.
스타터 통합 문서에서 Quantile Starter 시트를 클릭합니다.
상단의 분석 메뉴를 연 다음 계산된 필드 만들기를 선택합니다.
계산 에디터에서 다음 작업을 수행합니다.
- 계산 이름을 Quantile of Life Expectancy vs Spending으로 지정합니다.
다음 수식을 입력합니다.
POWER(10, MODEL_QUANTILE(0.5, LOG(MEDIAN([Health Exp/Capita])), AVG([Life Expectancy Female])))
이 계산을 더 정확하게 파악하기 위해 분석해 보겠습니다.
- 계산은 MODEL_QUANTILE로 시작합니다. 여기서 첫 번째 인수는 0.5이며 예측할 백분위수를 지정합니다.
- 대상 식은 1인당 평균 의료비입니다.
- 예측자는 여성 평균 기대 수명입니다.
- 또한 로그 변환된 대상 식을 다시 달러로 변환하기 위해 POWER 함수로 함수를 둘러쌉니다.
확인을 클릭합니다.
이제 예측 계산이 데이터 패널에서 계산된 필드로 추가됩니다.
2단계: 뷰에 예측 계산 추가
Quantile of Life Expectancy vs Spending을 마크 카드의 도구 설명으로 끌어옵니다.
알약 모양의 드롭다운 화살표를 클릭하고 계산 도구 > 국가/지역을 선택합니다.
마크 카드에서 도구 설명을 클릭하고 MODEL_QUANTILE 예측에 대한 행을 추가합니다.
도구 설명 행의 이름을 Predicted Health Spend from Female Life Expectancy로 지정합니다.
삽입을 클릭하고 계산을 선택하여 비주얼리제이션과 상호 작용할 때 도구 설명에 마크의 고유한 예측이 동적으로 표시되게 합니다.
확인을 클릭합니다.
현재 MODEL_QUANTILE 계산에는 여성 기대 수명이라는 예측자 하나만 있습니다. 왼쪽에서 오른쪽으로 이동하면서 기대 수명이 같은 마크의 도구 설명을 보면 각 마크에 동일한 예상 의료비 지출이 있음을 알 수 있습니다. 인도네시아의 기대 수명에서 예상되는 의료비 지출은 336달러이지만 피지, 이집트 및 다른 여성 기대 수명이 같은 국가도 마찬가지입니다.
이것은 모델이 각 마크에 대해 동일한 예상 지출을 제공하기 때문입니다. 여기에서는 하나의 예측자(여성 기대 수명)만 사용하므로 모델은 예측자가 동일한 값을 갖는 모든 마크에 대해 동일한 결과를 반환합니다. 예측자를 추가하여 모델에 더 많은 의미를 부여할 수 있습니다.
3단계: 두 번째 예측자를 사용하여 예측 추가
예측을 작성할 때 어떤 필드가 대상 값에 대한 좋은 예측자가 될지 고려하고 계산에 포함해야 합니다. 원하는 수의 차원과 측정값을 결합할 수 있습니다. 예를 들어 GDP, 인구 및 기타 필드를 예측자로 추가하여 예측을 개선할 수 있습니다. 이 경우 Region(지역)을 추가하겠습니다.
계산 에디터에서 다음 작업을 수행합니다.
계산 이름을 Quantile Spend vs Expectancy & Region으로 지정합니다.
이전 계산과 동일하지만 Region(지역)을 예측자로 추가하는 다음 수식을 입력합니다.
POWER(10, MODEL_QUANTILE(0.5, LOG(MEDIAN([Health Exp/Capita])), AVG([Life Expectancy Female]), ATTR([Region])))
확인을 클릭합니다.
다음으로 마크 카드의 도구 설명에 새 계산을 추가합니다.
도구 설명을 클릭하고 새로운 예측을 설명하는 다른 줄을 추가합니다(예: Predicted Health Spend from Female Life Expectancy & Region:).
이제 도구 설명이 두 가지 예측을 모두 표시합니다.
4단계: 실제 값과 예측 값 비교
분석의 마지막 단계로, 실제 값과 예측 값을 결합하는 예측 계산을 작성할 수도 있습니다. 이 예에서는 사용할 수 있는 경우 실제 의료비 지출을 표시하고 사용할 수 없는 경우 예상 지출을 표시합니다.
계산 에디터에서 다음 작업을 수행합니다.
계산 이름을 Health Spend Actual vs Prediction Value로 지정합니다.
예측의 숫자 값을 반환하는 다음 수식을 입력합니다.
ROUND(IFNULL(AVG([Health Exp/Capita]),[Quantile_HE/Cap_LEF,Region]),0)
확인을 클릭합니다.
다음과 같이 또 다른 계산을 만듭니다.
계산 이름을 Health Spend Actual vs Prediction Tag로 지정합니다.
위 계산의 레이블 역할을 할 다음 수식을 입력합니다.
STR(IF ISNULL(AVG([Health Exp/Capita])) THEN "(Estimate)" ELSE "(Actual)" END)
확인을 클릭합니다.
다음으로 두 계산을 모두 마크 카드의 도구 설명에 추가합니다.
도구 설명을 클릭하고 새 계산을 설명하는 또 다른 줄을 추가합니다.
Per Capita Health Expenditure (Actual or Estimated):
새 계산을 차례로 삽입합니다.
확인을 클릭합니다.
이제 비주얼리제이션과 상호 작용할 때 각 국가의 1인당 의료비 지출을 보거나 데이터에서 실제 값이 누락된 경우(null) 추정치를 볼 수 있습니다.
이와 같은 방법으로, Tableau에서 예측 모델링 함수를 사용하여 데이터에 대한 통찰력을 얻을 수 있습니다.