範例 - 利用預測建模函數探索女性預期壽命
此範例使用 Tableau 附帶的世界指標已儲存資料來源。我們將使用 MODEL_QUANTILE 和 MODEL_PERCENTILE 預測建模函數來探索平均每人醫療支出、女性預期壽命、出生率之間的關係。
讓我們從視覺效果開始,將每個國家/地區的醫療支出與女性預期壽命進行比較。若要繼續操作並存取預建的檢視和儀表板,或是要檢視解決方案,請從 Tableau Public 下載以下工作簿:女性預期壽命的預測建模。
使用 MODEL_PERCENTILE
首先,我們將評估所有可見標記的預期壽命和醫療支出。這可讓 Tableau 從這些標記建立模型,並針對模型中每個標記傳回百分位數。
步驟 1:建立預測計算
如果您也有 Tableau Server 或 Tableau Cloud,並且想要在 Web 上而不是 Tableau Desktop 中進行製作,請將工作簿發佈到 Tableau Server,按一下「工作簿」,選取工作簿,然後在「動作」下方,選擇「編輯工作簿」。
開啟工作簿後,您會看到幾個工作表。您將使用這些工作表來建立您的檢視。
在樣板工作簿中,按一下「百分位數樣板」工作表。
開啟頂端的「分析」功能表,然後選取「建立導出欄位」。
在「計算編輯器」中,執行以下操作:
命名計算:預期與支出百分位數
輸入以下公式:
MODEL_PERCENTILE(AVG([Life Expectancy Female]), LOG(MEDIAN([Health Exp/Capita])))
按一下「確定」。
預測計算現在作為計算欄位新增到「資料」窗格中。
此計算使用平均預期壽命做為目標運算式,將醫療支出中位數做為預測值。在這種情況下,我們在醫療支出軸以及針對預測值使用對數轉換。
步驟 2:將預測計算新增至檢視
在上述的視覺效果中,您可以看見每個國家/地區的醫療支出及其女性預期壽命的比對,篩選至 2012 年。
現在,讓我們將 MODEL_PERCENTILE 計算新增至檢視中,並看看得到什麼樣的洞察。
將「預期與支出百分位數」拖曳至「標記」卡片的「色彩」中。
按一下膠囊上的下拉箭頭,並選取「計算使用」>「國家/地區」。
在「標記」卡片上按一下「色彩」,然後按一下「編輯色彩」。
在「調色盤」下,選取「橙色-藍色發散」。
選取「漸變色彩」核取方塊。
選取「反向」核取方塊。
按一下「確定」。
根據支出層級,您可以看到健康預期高於和低於預期的國家/地區分佈情況。請注意,根據醫療保健支出的層級,深紅色標記通常表示預期壽命相對高於醫療保健支出,深藍色表示預期壽命相對低於醫療保健支出,灰色表示預期壽命接近模型預期。
步驟 3:依顏色對結果進行分組
為了簡化分析,讓我們使用新計算中的預測計算對結果進行分組。我們將建立群組,以便將第 90 個百分位以上和第 10 個百分位以下的標記分組在一起,將第 80 到 90 個百分位範圍內的標記和第 10 到 20 個百分位範圍內的標記分組在一起,依此類推。我們也將醒目顯示帶有 Null 值的標記,並在稍後使用另一個預測建模函數 MODEL_QUANTILE 來解決這些問題。
在「計算編輯器」中,執行以下操作:
命名計算:百分位數 - 依顏色。
輸入以下公式:
IF
ISNULL([Percentile Expectancy vs Spending])
THEN "Null"
ELSEIF [Percentile Expectancy vs Spending] >=0.9 OR
[Percentile Expectancy vs Spending] <=0.1
THEN "<10th & >90th percentile"
ELSEIF [Percentile Expectancy vs Spending] >=0.8 OR
[Percentile Expectancy vs Spending] <=0.2
THEN "<20th & >80th percentile"
ELSEIF [Percentile Expectancy vs Spending] >=0.7 OR
[Percentile Expectancy vs Spending] <=0.3
THEN "<30th & >70th percentile"
ELSEIF [Percentile Expectancy vs Spending] >=0.6 OR
[Percentile Expectancy vs Spending] <=0.4
THEN "<40th & >60th percentile"
ELSE "50th percentile +-10"
END將新計算新增至「標記」卡片上的「色彩」。
按一下膠囊上的下拉箭頭,並選取「計算使用」>「國家/地區」。
在「標記」卡片上按一下「色彩」,然後按一下「編輯色彩」。
調整顏色,以便趨勢一目了然。在此情況下,請使用「Traffic Light」調色盤,並針對 Null 使用灰色。
按一下「確定」。
看看角落的橘色標記,注意到每位美國女性在 81 歲的預期壽命中花費了 8,895 美元。沿著 X 軸向左移動,您可以看到其他國家/地區的支出較少,但預期壽命相同。
此模型會評估每個點的關係強度,其中美國接近模型預期範圍的上端。
步驟 4:將預期壽命與出生率進行比較
接下來,讓我們來看看將女性預期壽命與出生率進行比較的視覺效果。請注意,出生率與女性預期壽命呈負相關;然而,這並不代表較高的出生率會導致女性預期壽命降低。在此資料檢視中,可能有其他不可見的因素影響出生率和女性預期壽命。但是,讓我們新增模型,看看在醫療支出的情況下,模型預期女性預期壽命較高或較低的地方在哪裡。
在「出生率」工作表中,將「百分位數 - 依色彩」預測計算新增至「標記」卡片上的「色彩」,以將其帶入檢視中。
按一下膠囊上的下拉箭頭,並選取「計算使用」>「國家/地區」。
在「標記」卡片上按一下「色彩」,然後按一下「編輯色彩」。像先前一樣編輯色彩,然後按一下「Traffic Light」調色盤,並針對 Null 值選取灰色。
按一下「確定」。
現在,資料更加分散了。右下角的紅色區間是預期壽命最低但出生率最高的地方,與預期壽命相比,醫療保健支出較低。在左上象限中挑選出兩個紅色標記(與阿爾巴尼亞和亞美尼亞有關),您會發現這兩個國家/地區的女性預期壽命高、出生率低,而且醫療支出低。
正如您所看到的,我們能夠使用 MODEL_PERCENTILE 來識別這兩個國家/地區為離群值:儘管它們都有相對較低的醫療保健支出,但從出生率的角度來看,它們的預期壽命仍然相對較高。
現在,讓我們看看如何使用其他預測建模函數 (MODEL_QUANTILE) 繼續分析。
使用 MODEL_QUANTILE
MODEL_QUANTILE 用於產生數值預測、給定目標百分位數、目標運算式和預測值。這是 MODEL_PERCENTILE 的反函數。
提醒您,我們的結果中有幾個 Null 值,表示某些國家/地區沒有醫療支出資料。我們將使用 MODEL_QUANTILE 評估這些缺少的值。
步驟 1:建立預測計算
我們一直在處理此計算:
MODEL_PERCENTILE(AVG([Life Expectancy Female]), LOG(MEDIAN([Health Exp/Capita])))
首先,我們希望反轉此函數,以便根據女性預期壽命獲得醫療保健支出的預測。
在樣板工作簿中,按一下「分位數樣板」工作表。
開啟頂端的「分析」功能表,然後選取「建立導出欄位」。
在「計算編輯器」中,執行以下操作:
- 命名計算:預期壽命與支出分位數
輸入以下公式:
POWER(10, MODEL_QUANTILE(0.5, LOG(MEDIAN([Health Exp/Capita])), AVG([Life Expectancy Female])))
讓我們仔細分析此計算,以便深入瞭解:
- 我們從 MODEL_QUANTILE 開始,其中第一個引數為 0.5,指定要預測的百分位數。
- 目標運算式是平均每人醫療支出中位數。
- 預測值是平均女性預期壽命。
- 此外,我們將函數包裝在 POWER 函數中,以將對數轉換的目標運算式轉換回美元。
按一下「確定」。
預測計算現在作為計算欄位新增到「資料」窗格中。
步驟 2:將預測計算新增至檢視
將「預期壽命與支出分位數」拖曳至「標記」卡片上的「工具提示」。
按一下膠囊上的下拉箭頭,並選取「計算使用」>「國家/地區」。
按一下「標記」卡片上的「工具提示」,並針對 MODEL_QUANTILE 預測新增列:
命名工具提示列:從女性預期壽命預測醫療支出:
按一下「插入」,並選取計算,以確保在您與視覺效果進行互動時,工具提示會動態顯示標記的唯一預測。
按一下「確定」。
現在,我們的 MODEL_QUANTILE 只有一個預測值:女性預期壽命。請注意,當您從左向右移動時,針對具有相同預期壽命的標記檢視工具提示,會發現每個標記都有相同的預測醫療支出。印尼從預期壽命預測的醫療支出為 336 美元,但斐濟、埃及和其他女性預期壽命相同的國家/地區也是相同的結果。
這是因為模型為每個標記提供相同的估計支出。由於我們僅使用一個預測值(女性預期壽命),因此,模型會針對預測值具有相同值的所有標記傳回相同結果。您可以藉由新增預測值,將更多細微差別新增至模型。
步驟 3:使用第二個預測值新增預測
當您建立預測時,應該考慮到哪些欄位對您的目標值而言是良好的預測值,並將其加入您的計算中。您可以接受任意數目的維度和度量。例如,我們可以新增 GDP、人口和其他欄位做為預測值,以改善我們的預測。在此情況下,讓我們新增「區域」。
在「計算編輯器」中,執行以下操作:
命名計算:支出和預期與區域的分位數
輸入以下公式,與先前計算相同,但新增「區域」做為預測值:
POWER(10, MODEL_QUANTILE(0.5, LOG(MEDIAN([Health Exp/Capita])), AVG([Life Expectancy Female]), ATTR([Region])))
按一下「確定」。
接著,將新計算新增至「標記」卡片上的「工具提示」。
按一下「工具提示」,並新增其他行以描述新預測,例如「從女性預期壽命和區域預測醫療支出:」。
現在,工具提示顯示兩個預測。
步驟 4:將實際值和預測值進行比較
做為分析的最後一步,您還可以建立結合實際值和預測值的預測計算。在我們的範例中,顯示可用的實際醫療支出和不可用的估計支出。
在「計算編輯器」中,執行以下操作:
命名計算:醫療支出實際值和預測值
輸入以下公式,該公式會傳回預測的數值:
ROUND(IFNULL(AVG([Health Exp/Capita]),[Quantile_HE/Cap_LEF,Region]),0)
按一下「確定」。
建立另一個計算,如下所示:
命名計算:醫療支出實際值和預測值標記
輸入以下公式,該公式將做為上述計算的標籤:
STR(IF ISNULL(AVG([Health Exp/Capita])) THEN "(Estimate)" ELSE "(Actual)" END)
按一下「確定」。
接著,將兩個計算新增至「標記」卡片上的「工具提示」。
按一下「工具提示」,並新增另一行以描述新計算:
平均每人醫療支出(實際或估計):
插入新計算,一個接著一個。
按一下「確定」。
現在,當您與視覺效果互動時,可以看見每個國家/地區的平均每人醫療支出,或如果資料缺少實際值(Null 值),則檢視預估值。
就像這樣,您可以使用 Tableau 中的預測建模函數,深入瞭解您的資料。