範例 - 利用預測建模函數探索女性預期壽命

此範例使用 Tableau 附帶的世界指標已儲存資料來源。我們將使用 MODEL_QUANTILE 和 MODEL_PERCENTILE 預測建模函數來探索平均每人醫療支出、女性預期壽命、出生率之間的關係。

讓我們從視覺效果開始,將每個國家/地區的醫療支出與女性預期壽命進行比較。若要繼續操作並存取預建的檢視和儀表板,或是要檢視解決方案,請從 Tableau Public 下載以下工作簿:女性預期壽命的預測建模

女性預期壽命散佈圖

使用 MODEL_PERCENTILE

首先,我們將評估所有可見標記的預期壽命和醫療支出。這可讓 Tableau 從這些標記建立模型,並針對模型中每個標記傳回百分位數。

步驟 1:建立預測計算

如果您也有 Tableau Server 或 Tableau Cloud,並且想要在 Web 上而不是 Tableau Desktop 中進行製作,請將工作簿發佈到 Tableau Server,按一下「工作簿」,選取工作簿,然後在「動作」下方,選擇「編輯工作簿」

開啟工作簿後,您會看到幾個工作表。您將使用這些工作表來建立您的檢視。

  1. 在樣板工作簿中,按一下「百分位數樣板」工作表。

  2. 開啟頂端的「分析」功能表,然後選取「建立導出欄位」

  3. 在「計算編輯器」中,執行以下操作:

    • 命名計算:預期與支出百分位數

    • 附註:如果您在樣板工作簿中照著操作,會看見此範例中使用的計算有不同名稱。這是為了讓您能夠命名欄位(如前所述),而不會產生重複項目。您的解決方案可能具有不同的名稱,但視覺效果的外觀應該相同。
    • 輸入以下公式:

      MODEL_PERCENTILE(AVG([Life Expectancy Female]), LOG(MEDIAN([Health Exp/Capita])))

    • 此計算使用平均預期壽命做為目標運算式,將醫療支出中位數做為預測值。在這種情況下,我們在醫療支出軸以及針對預測值使用對數轉換。

      附註:由於此資料集偏向於非常大的值,我們使用對數標度轉換資料,這對於分析少數值比其他值高很多的資料時相當有用,並且更容易識別資料集中的趨勢與關係。
  4. 按一下「確定」

    預測計算現在作為計算欄位新增到「資料」窗格中。

步驟 2:將預測計算新增至檢視

在上述的視覺效果中,您可以看見每個國家/地區的醫療支出及其女性預期壽命的比對,篩選至 2012 年。

現在,讓我們將 MODEL_PERCENTILE 計算新增至檢視中,並看看得到什麼樣的洞察。

  1. 「預期與支出百分位數」拖曳至「標記」卡片的「色彩」中。

  2. 按一下膠囊上的下拉箭頭,並選取「計算使用」>「國家/地區」

  3. 在「標記」卡片上按一下「色彩」,然後按一下「編輯色彩」

    • 在「調色盤」下,選取「橙色-藍色發散」

    • 選取「漸變色彩」核取方塊。

    • 選取「反向」核取方塊。

  4. 按一下「確定」

  5. 顯示女性相對於支出的預期壽命的圖

    根據支出層級,您可以看到健康預期高於和低於預期的國家/地區分佈情況。請注意,根據醫療保健支出的層級,深紅色標記通常表示預期壽命相對高於醫療保健支出,深藍色表示預期壽命相對低於醫療保健支出,灰色表示預期壽命接近模型預期。

步驟 3:依顏色對結果進行分組

為了簡化分析,讓我們使用新計算中的預測計算對結果進行分組。我們將建立群組,以便將第 90 個百分位以上和第 10 個百分位以下的標記分組在一起,將第 80 到 90 個百分位範圍內的標記和第 10 到 20 個百分位範圍內的標記分組在一起,依此類推。我們也將醒目顯示帶有 Null 值的標記,並在稍後使用另一個預測建模函數 MODEL_QUANTILE 來解決這些問題。

  1. 在「計算編輯器」中,執行以下操作:

    • 命名計算:百分位數 - 依顏色

    • 輸入以下公式:

      IF
      ISNULL([Percentile Expectancy vs Spending])
      THEN "Null"
      ELSEIF [Percentile Expectancy vs Spending] >=0.9 OR
      [Percentile Expectancy vs Spending] <=0.1
      THEN "<10th & >90th percentile"
      ELSEIF [Percentile Expectancy vs Spending] >=0.8 OR
      [Percentile Expectancy vs Spending] <=0.2
      THEN "<20th & >80th percentile"
      ELSEIF [Percentile Expectancy vs Spending] >=0.7 OR
      [Percentile Expectancy vs Spending] <=0.3
      THEN "<30th & >70th percentile"
      ELSEIF [Percentile Expectancy vs Spending] >=0.6 OR
      [Percentile Expectancy vs Spending] <=0.4
      THEN "<40th & >60th percentile"
      ELSE "50th percentile +-10"
      END

  2. 將新計算新增至「標記」卡片上的「色彩」

  3. 按一下膠囊上的下拉箭頭,並選取「計算使用」>「國家/地區」

  4. 在「標記」卡片上按一下「色彩」,然後按一下「編輯色彩」

    • 調整顏色,以便趨勢一目了然。在此情況下,請使用「Traffic Light」調色盤,並針對 Null 使用灰色。

  5. 按一下「確定」

    顯示按色彩分組結果的圖

    看看角落的橘色標記,注意到每位美國女性在 81 歲的預期壽命中花費了 8,895 美元。沿著 X 軸向左移動,您可以看到其他國家/地區的支出較少,但預期壽命相同。

    此模型會評估每個點的關係強度,其中美國接近模型預期範圍的上端。

步驟 4:將預期壽命與出生率進行比較

接下來,讓我們來看看將女性預期壽命與出生率進行比較的視覺效果。請注意,出生率與女性預期壽命呈負相關;然而,這並不代表較高的出生率會導致女性預期壽命降低。在此資料檢視中,可能有其他不可見的因素影響出生率和女性預期壽命。但是,讓我們新增模型,看看在醫療支出的情況下,模型預期女性預期壽命較高或較低的地方在哪裡。

按出生率的預期壽命

  1. 「出生率」工作表中,將「百分位數 - 依色彩」預測計算新增至「標記」卡片上的「色彩」,以將其帶入檢視中。

  2. 按一下膠囊上的下拉箭頭,並選取「計算使用」>「國家/地區」

  3. 在「標記」卡片上按一下「色彩」,然後按一下「編輯色彩」。像先前一樣編輯色彩,然後按一下「Traffic Light」調色盤,並針對 Null 值選取灰色。

  4. 按一下「確定」

    聚焦在阿爾巴尼亞和亞美尼亞地區結果的圖

    現在,資料更加分散了。右下角的紅色區間是預期壽命最低但出生率最高的地方,與預期壽命相比,醫療保健支出較低。在左上象限中挑選出兩個紅色標記(與阿爾巴尼亞和亞美尼亞有關),您會發現這兩個國家/地區的女性預期壽命高、出生率低,而且醫療支出低。

    正如您所看到的,我們能夠使用 MODEL_PERCENTILE 來識別這兩個國家/地區為離群值:儘管它們都有相對較低的醫療保健支出,但從出生率的角度來看,它們的預期壽命仍然相對較高。

    工具提示顯示,即使醫療支出低,阿爾巴尼亞地區的預期壽命也很長

  5. 現在,讓我們看看如何使用其他預測建模函數 (MODEL_QUANTILE) 繼續分析。

使用 MODEL_QUANTILE

MODEL_QUANTILE 用於產生數值預測、給定目標百分位數、目標運算式和預測值。這是 MODEL_PERCENTILE 的反函數。

提醒您,我們的結果中有幾個 Null 值,表示某些國家/地區沒有醫療支出資料。我們將使用 MODEL_QUANTILE 評估這些缺少的值。

步驟 1:建立預測計算

我們一直在處理此計算:

MODEL_PERCENTILE(AVG([Life Expectancy Female]), LOG(MEDIAN([Health Exp/Capita])))

首先,我們希望反轉此函數,以便根據女性預期壽命獲得醫療保健支出的預測。

  1. 在樣板工作簿中,按一下「分位數樣板」工作表。

  2. 開啟頂端的「分析」功能表,然後選取「建立導出欄位」

  3. 在「計算編輯器」中,執行以下操作:

    • 命名計算:預期壽命與支出分位數
    • 輸入以下公式:

      POWER(10, MODEL_QUANTILE(0.5, LOG(MEDIAN([Health Exp/Capita])), AVG([Life Expectancy Female])))

      讓我們仔細分析此計算,以便深入瞭解:

      • 我們從 MODEL_QUANTILE 開始,其中第一個引數為 0.5,指定要預測的百分位數。
      • 目標運算式是平均每人醫療支出中位數。
      • 預測值是平均女性預期壽命。
      • 此外,我們將函數包裝在 POWER 函數中,以將對數轉換的目標運算式轉換回美元。
  4. 按一下「確定」

    預測計算現在作為計算欄位新增到「資料」窗格中。

步驟 2:將預測計算新增至檢視

  1. 「預期壽命與支出分位數」拖曳至「標記」卡片上的「工具提示」。

  2. 按一下膠囊上的下拉箭頭,並選取「計算使用」>「國家/地區」

  3. 按一下「標記」卡片上的「工具提示」,並針對 MODEL_QUANTILE 預測新增列:

    • 命名工具提示列:從女性預期壽命預測醫療支出:

    • 按一下「插入」,並選取計算,以確保在您與視覺效果進行互動時,工具提示會動態顯示標記的唯一預測。

  4. 按一下「確定」

    印尼的工具提示

  5. 現在,我們的 MODEL_QUANTILE 只有一個預測值:女性預期壽命。請注意,當您從左向右移動時,針對具有相同預期壽命的標記檢視工具提示,會發現每個標記都有相同的預測醫療支出。印尼從預期壽命預測的醫療支出為 336 美元,但斐濟、埃及和其他女性預期壽命相同的國家/地區也是相同的結果。

    這是因為模型為每個標記提供相同的估計支出。由於我們僅使用一個預測值(女性預期壽命),因此,模型會針對預測值具有相同值的所有標記傳回相同結果。您可以藉由新增預測值,將更多細微差別新增至模型。

步驟 3:使用第二個預測值新增預測

當您建立預測時,應該考慮到哪些欄位對您的目標值而言是良好的預測值,並將其加入您的計算中。您可以接受任意數目的維度和度量。例如,我們可以新增 GDP、人口和其他欄位做為預測值,以改善我們的預測。在此情況下,讓我們新增「區域」

  1. 在「計算編輯器」中,執行以下操作:

    • 命名計算:支出和預期與區域的分位數

    • 輸入以下公式,與先前計算相同,但新增「區域」做為預測值:

      POWER(10, MODEL_QUANTILE(0.5, LOG(MEDIAN([Health Exp/Capita])), AVG([Life Expectancy Female]), ATTR([Region])))

  2. 按一下「確定」

  3. 接著,將新計算新增至「標記」卡片上的「工具提示」。

  4. 按一下「工具提示」,並新增其他行以描述新預測,例如「從女性預期壽命和區域預測醫療支出:」

    印尼的工具提示

    現在,工具提示顯示兩個預測。

步驟 4:將實際值和預測值進行比較

做為分析的最後一步,您還可以建立結合實際值和預測值的預測計算。在我們的範例中,顯示可用的實際醫療支出和不可用的估計支出。

  1. 在「計算編輯器」中,執行以下操作:

    • 命名計算:醫療支出實際值和預測值

    • 輸入以下公式,該公式會傳回預測的數值:

      ROUND(IFNULL(AVG([Health Exp/Capita]),[Quantile_HE/Cap_LEF,Region]),0)

  2. 按一下「確定」

  3. 建立另一個計算,如下所示:

    • 命名計算:醫療支出實際值和預測值標記

    • 輸入以下公式,該公式將做為上述計算的標籤:

      STR(IF ISNULL(AVG([Health Exp/Capita])) THEN "(Estimate)" ELSE "(Actual)" END)

  4. 按一下「確定」

  5. 接著,將兩個計算新增至「標記」卡片上的「工具提示」

  6. 按一下「工具提示」,並新增另一行以描述新計算:

    • 平均每人醫療支出(實際或估計):

    • 插入新計算,一個接著一個。

  7. 按一下「確定」

    用於百慕達的工具提示

    現在,當您與視覺效果互動時,可以看見每個國家/地區的平均每人醫療支出,或如果資料缺少實際值(Null 值),則檢視預估值。

    就像這樣,您可以使用 Tableau 中的預測建模函數,深入瞭解您的資料。

感謝您的意見反應!已成功提交您的意見回饋。謝謝!