予測モデルの選択

予測モデリング関数は、線形回帰、正規化線形回帰、およびガウス プロセス回帰をサポートします。これらのモデルは、さまざまなユース ケースと予測タイプをサポートするほか、制限も異なります。

サポートされているモデル

線形回帰

線形回帰(新しいウィンドウでリンクが開く) (通常の最小二乗回帰または OLS とも呼ばれる) は、予測と予測ターゲットの間に線形関係を持つ予測変数が 1 つまたは複数あり、これらの予測変数が基礎となる同じ条件の影響を受けず、同じデータの 2 つのインスタンス (たとえば、ドルとユーロで表される売上高) を表さない場合に使用するのが最適です。線形回帰は、Tableau の予測モデリング関数の既定のモデルです。モデルを指定しない場合は、線形回帰が使用されます。このモデルは、表計算の最初の引数として "model=linear" を含めることによって明示的に指定できます。

例:

MODEL_QUANTILE(
"model=linear",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)

正規化線形回帰

正規化線形回帰(新しいウィンドウでリンクが開く)は、2 つ以上の独立変数の間に近似線形関係がある場合に使用するのが最適であり、多重共線性(新しいウィンドウでリンクが開く)とも呼ばれます。これは、実際のデータ セットで頻繁に見られます。既定の線形回帰の代わりに、このモデルを使用するには、表計算の最初の引数として "model=rl" を含めます。

例:

MODEL_QUANTILE(
"model=rl",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)

ガウス プロセス回帰

ガウス プロセス回帰(新しいウィンドウでリンクが開く)は、時間や空間などの連続ドメインで予測を生成する場合や、変数と予測ターゲットの間に非線形関係がある場合に使用するのが最適です。Tableau のガウス プロセス回帰は、予測変数として 1 つの順序付きディメンションを持つ必要がありますが、予測変数として複数の非順序付きディメンションを含めることができます。メジャーは、Tableau のガウス プロセス回帰では予測変数として使用できないことに注意してください。既定の線形回帰の代わりに、このモデルを使用するには、表計算の最初の引数として "model=gp" を含めます。

注: 順序付きディメンションとは、値をシーケンスできるディメンション (MONTH など) です。非順序付きディメンションとは、値に性別や色などの固有のシーケンスがないディメンションです。

例:

MODEL_PERCENTILE(
"model=gp",
AVG([Days to Ship Actual]),
ATTR(DATETRUNC('month',([Order Date])))
)


単純なヒューリスティックとして、以下の基準を使用してモデルを選択できます。

  • 線形回帰 (既定): 予測変数が 1 つしかなく、その予測変数がターゲット メトリクスに対して線形関係を持つ場合に使用します。

  • 正規化線形回帰: 複数の予測変数がある場合、特にそれらの予測変数がターゲット メトリクスに対して線形関係を持ち、それらの予測変数が基礎となる類似の関係や傾向の影響を受ける可能性がある場合に使用します。

  • ガウス プロセス回帰: 時間予測変数または空間予測変数がある場合、またはターゲット メトリクスに対して線形関係を持たない可能性がある予測変数を使用する場合に使用します。

フィードバックをありがとうございます。フィードバックは正常に送信されました。ありがとうございます!