例 - 予測モデリング関数を使用した女性の平均寿命の調査

この例では、Tableau に付属している、世界指標の保存済みデータ ソースを使用します。予測モデリング関数 MODEL_QUANTILE と MODEL_PERCENTILE を使用して、一人当たりの保険医療費、女性の平均寿命、出生率の関係を調べます。

まず、各国の保険医療費と女性の平均寿命を比較するビジュアライゼーションから始めましょう。手順に従って作成済みのビューとダッシュボードにアクセスし、ソリューションを表示するために、Tableau Public から次のワークブックをダウンロードしてください:「女性の平均寿命の予測モデリング」

女性の平均寿命を示す散布図

MODEL_PERCENTILE の使用

まず、表示されているマークの平均寿命と保険医療費を評価します。これにより、Tableau はこれらのマークからモデルを構築し、モデル内の各パーセンタイルを返します。

ステップ 1: 予測計算を作成する

Tableau Desktop ではなく Tableau Server または Tableau Cloud を利用して Web 上で作成したい場合は、ワークブックを Tableau Server にパブリッシュしてください。[ワークブック] をクリックしてワークブックを選択してから、[アクション] にある [ワークブックの編集] を選択します。

ワークブックを開くと、いくつかのシートが含まれていることを確認できます。これらのシートを使用してビューを作成します。

  1. スターター ワークブックで、[パーセンタイル スターター] シートをクリックします。

  2. 上部の [分析] メニューを開き、[計算フィールドの作成] を選択します。

  3. 計算エディターで、次の手順を実行します。

    • 計算に名前を付けます: 保険医療費に対する平均寿命の比率

    • 注: スターター ワークブックの手順では、この例で使用している計算とは異なる名前が表示されます。ここで説明するようにフィールドに名前を付けることができますので、重複して作成する必要はありません。ソリューションの名前は異なるかもしれませんが、ビジュアライゼーションは同じように見えるはずです。
    • 次の式を入力します。

      MODEL_PERCENTILE(AVG([Life Expectancy Female]), LOG(MEDIAN([Health Exp/Capita])))

    • この計算では、平均寿命を目標式として使用し、保険医療費の中央値を予測変数として使用しています。ここでは、保険医療費の軸と予測変数に対数変換を使用しています。

      注: このデータセットは非常に大きな値に偏っているので、対数目盛を使用してデータを変換しました。これは、他の値よりもはるかに大きな値がいくつかあるデータを分析するときに役立ち、データの傾向と関係を特定しやすくなります。
  4. [OK] をクリックします。

    予測計算が [データ] ペインに計算フィールドとして追加されます。

ステップ 2: ビューに予測計算を追加する

上記の viz では、女性の平均寿命に対する各国の保険医療費を 2012 年でフィルターリングして見ることができます。

次に、MODEL_PERCENTILE 計算をビューに追加し、どのような洞察を得ることができるかを見てみましょう。

  1. [保険医療費に対する平均寿命の比率] をマーク カードの [色] にドラッグします。

  2. ピルのドロップダウン矢印をクリックし、[次を使用した計算] > [国/地域] を選択します。

  3. マーク カードで [色] をクリックし、[色の編集] をクリックします。

    • [パレット] で [オレンジ - 青の分岐] を選択します。

    • [ステップ カラー] のチェックボックスを選択します。

    • [反転] のチェックボックスを選択します。

  4. [OK] をクリックします。

  5. 支出に関連した女性の平均寿命を示すプロット

    保険医療費のレベルに応じて、平均寿命が予想よりも高い国と低い国の分布を見ることができます。一般的に、濃い赤いマークは平均寿命が保険医療費のレベルに対して長いことを示し、濃い青のマークは短いことを示し、灰色のマークはモデルの期待値に近いことを意味します。

ステップ 3: 色で結果をグループ化する

分析を簡単にするために、新しい計算の中で予測計算を使用して、結果をグループ化しましょう。グループを作成して、90 パーセンタイルを超えるマークと 10 パーセンタイルより下のマークをグループにまとめ、80~90 パーセンタイル範囲のマークと 10~20 パーセンタイル範囲のマークをグループにまとめます。また、null 値のマークを強調表示し、後で別の予測モデリング関数 MODEL_QUANTILE を使用して取り上げます。

  1. 計算エディターで、次の手順を実行します。

    • 計算に名前を付けます: 色で分けた比率

    • 次の式を入力します。

      IF
      ISNULL([Percentile Expectancy vs Spending])
      THEN "Null"
      ELSEIF [Percentile Expectancy vs Spending] >=0.9 OR
      [Percentile Expectancy vs Spending] <=0.1
      THEN "<10th & >90th percentile"
      ELSEIF [Percentile Expectancy vs Spending] >=0.8 OR
      [Percentile Expectancy vs Spending] <=0.2
      THEN "<20th & >80th percentile"
      ELSEIF [Percentile Expectancy vs Spending] >=0.7 OR
      [Percentile Expectancy vs Spending] <=0.3
      THEN "<30th & >70th percentile"
      ELSEIF [Percentile Expectancy vs Spending] >=0.6 OR
      [Percentile Expectancy vs Spending] <=0.4
      THEN "<40th & >60th percentile"
      ELSE "50th percentile +-10"
      END

  2. 新しい計算をマーク カードの [色] に追加します。

  3. ピルのドロップダウン矢印をクリックし、[次を使用した計算] > [国/地域] を選択します。

  4. マーク カードで [色] をクリックし、[色の編集] をクリックします。

    • 傾向を見やすくするために色を調整します。ここでは [交通信号] のカラー パレットを使用し、Null の場合はグレーを使用しましょう。

  5. [OK] をクリックします。

    色でグループ化された結果を示すプロット

    隅にあるオレンジ色のマークを見ると、米国は女性の平均寿命が 81 歳であるのに対して、1 人あたり 8,895 ドルの保険医療費を支払っていることがわかります。X 軸に沿って左に移動すると、他の国では平均寿命が同じで保険医療費が少ないことがわかります。

    モデルを使用すると各点の関係の強さを評価することができます。米国はモデルが予測する範囲の上限に近い位置にあります。

ステップ 4: 平均寿命と出生率を比較する

次に、女性の平均寿命と出生率を比較する viz を見てみましょう。出生率と女性の平均寿命の間には負の相関関係があることに注意してください。ただし、これは出生率が高いために女性の平均寿命が短くなることを意味するものではありません。このデータのビューでは表示されていない、出生率と女性の平均寿命の両方に影響を与える要因が他にある可能性があります。モデルを追加して、保険医療費に対して女性の平均寿命が長いまたは短いとモデルが予測するところを見てみましょう。

出生率ごとの平均寿命

  1. [出生率] シートで、[色で分けた比率] の予測計算をマーク カードの [色] に追加して、ビューに表示します。

  2. ピルのドロップダウン矢印をクリックし、[次を使用した計算] > [国/地域] を選択します。

  3. マーク カードで [色] をクリックし、[色の編集] をクリックします。以前と同じように [交通信号] パレットと Null のグレーを使用して色を編集します。

  4. [OK] をクリックします。

    アルバニアとアルメニアの結果に焦点を当てたプロット

    これで、データが細かく区分されました。右下隅の赤い帯は、平均寿命が最も短いが出生率が最も高く、平均寿命に対する保険医療費が低いところです。左上象限にある 2 つの赤いマークは、アルバニアとアルメニアを選び出したものですが、両国の女性の平均寿命は長く、出生率は低く、保険医療費は低いことがわかります。

    ご覧のように、MODEL_PERCENTILE を使用すると、これら 2 つの国が外れ値であることを識別できました。どちらの国も保険医療費は比較的低いにもかかわらず、出生率の観点では平均寿命は比較的長いままです。

    アルバニアでは、医療費の支出が低いものの、平均寿命が高いことを示すツールヒント

  5. それでは、他の予測モデリング関数 MODEL_QUANTILEを使用して分析を続ける方法を見てみましょう。

MODEL_QUANTILE の使用

MODEL_QUANTILE を使用して、指定の目標パーセンタイル、目標式、予測変数に対する数値予測を生成します。これは、MODEL_PERCENTILE の逆関数です。

結果にはいくつかの null 値があり、一部の国には保険医療費のデータがないことを思い出してください。これらの足らない値を推定するには、MODEL_QUANTILE を使用します。

ステップ 1: 予測計算を作成する

次の計算はすでに行いました。

MODEL_PERCENTILE(AVG([Life Expectancy Female]), LOG(MEDIAN([Health Exp/Capita])))

まず、この関数を逆にして、女性の平均寿命に基づく保険医療費を予測します。

  1. スターター ワークブックで、[分位数スターター] シートをクリックします。

  2. 上部の [分析] メニューを開き、[計算フィールドの作成] を選択します。

  3. 計算エディターで、次の手順を実行します。

    • 計算に名前を付けます: 保険医療費に対する平均寿命の分位数
    • 次の式を入力します。

      POWER(10, MODEL_QUANTILE(0.5, LOG(MEDIAN([Health Exp/Capita])), AVG([Life Expectancy Female])))

      この計算を分解して理解を深めましょう。

      • まず、MODEL_QUANTILE は最初の引数が 0.5 であり、何の百分位数を予測するか指定しています。
      • 目標の式は、一人当たりの保険医療費の中央値です。
      • 予測変数は、女性の平均寿命です。
      • さらに、関数を POWER 関数の内部にラップしていて、対数変換された目標の式を金額に変換しています。
  4. [OK] をクリックします。

    予測計算が [データ] ペインに計算フィールドとして追加されます。

ステップ 2: ビューに予測計算を追加する

  1. [保険医療費に対する平均寿命の分位数] をマーク カードの [ツールヒント] にドラッグします。

  2. ピルのドロップダウン矢印をクリックし、[次を使用した計算] > [国/地域] を選択します。

  3. マーク カードの [ツールヒント] をクリックし、MODEL_QUANTILE 予測の行を追加します。

    • ツールヒント行に名前を付けます: 女性の平均寿命から予測した保険医療費

    • [挿入] をクリックして計算を選択し、viz を操作するときにツールヒントにマークの一意の予測が動的に表示されるようにします。

  4. [OK] をクリックします。

    インドネシアのツールヒント

  5. 今のところ、MODEL_QUANTILE 計算には、女性の平均寿命という 1 つの予測変数しかありません。左から右に移動して、平均寿命が同じであるマークのツールヒントを表示すると、それぞれに同じ予測保険医療費があることに注意してください。インドネシアの平均寿命から予測される保険医療費は 336 ドルですが、フィジー、エジプトなど、女性の平均寿命が同じ他の国も同様です。

    これは、各マークに対して同じ予測値の保険医療費をモデルが与えるためです。使用している予測変数が 1 つだけ (女性の平均寿命) のため、予測変数が同じ値を持つすべてのマークに対して、モデルは同じ結果を返します。予測変数を追加することで、モデルにさらにニュアンスを追加できます。

ステップ 3: 2 番目の予測変数を使用して予測を追加する

予測を作成するときは、どのフィールドがターゲット値に対して良い予測変数になるかを検討し、それらを計算に含める必要があります。ディメンションとメジャーはいくつでも組み合わせることができます。たとえば、予測変数として GDP や人口など、その他のフィールドを追加して予測を改善できます。ここでは 地域を追加しましょう。

  1. 計算エディターで、次の手順を実行します。

    • 計算に名前を付けます: 平均寿命と地域に対する保険医療費の分位数

    • 前の計算と同じ次の式を入力し、予測変数として [地域] を追加します。

      POWER(10, MODEL_QUANTILE(0.5, LOG(MEDIAN([Health Exp/Capita])), AVG([Life Expectancy Female]), ATTR([Region])))

  2. [OK] をクリックします。

  3. 次に、マーク カードの [ツールヒント] に新しい計算を追加します。

  4. [ツール ヒント] をクリックし、「女性の平均寿命と地域から予測した保険医療費」のように新しい予測を説明する行を追加します。

    インドネシアのツールヒント

    これで、ツールヒントに両方の予測が表示されます。

ステップ 4: 実際の値と予測値を比較する

分析の最後のステップとして、実績値と予測値を組み合わせた予測計算を作成します。この例では、データがある場合は実際の保険医療費を表示し、データがない場合は保険医療費の予測値を表示します。

  1. 計算エディターで、次の手順を実行します。

    • 計算に名前を付けます: 保険医療費の実績値と予測値

    • 予測の数値を返す、次の式を入力します。

      ROUND(IFNULL(AVG([Health Exp/Capita]),[Quantile_HE/Cap_LEF,Region]),0)

  2. [OK] をクリックします。

  3. 次のように別の計算を作成します。

    • 計算に名前を付けます: 保険医療費の実績値と予測値のタグ

    • 上記の計算のラベルとして機能する、次の式を入力します。

      STR(IF ISNULL(AVG([Health Exp/Capita])) THEN "(Estimate)" ELSE "(Actual)" END)

  4. [OK] をクリックします。

  5. 両方の計算をマーク カードの [ツール ヒント] に追加します。

  6. [ツール ヒント] をクリックし、新しい計算を説明する行を追加します。

    • 一人当たりの保険医療費 (実績値または予測値):

    • これらの新しい計算を順次挿入します。

  7. [OK] をクリックします。

    バミューダのツールヒント

    これで、Viz を操作するときに、各国の一人当たりの保険医療費を確認したり、データから実際の値が欠落していた場合 (null) には予測値を表示したりできます。

    このように、Tableau で予測モデリング関数を使用すると、データに関する洞察を得ることができます。

フィードバックをお送りいただき、ありがとうございます。フィードバックは正常に送信されました。ありがとうございます!