生成されたマークを使用した予測モデリング
Tableau を一定期間使用している方は、「データの高密度化」という言葉を聞いたことがあるかもしれません。データの高密度化は、参照元データ ソースのレコードでサポートされていないマークであっても、Tableau によってマークが生成され、ビューに追加されるプロセスを指します。このプロセスは、日付軸を拡張するために、または予測モデリング関数を使用している場合は予測を表示するために実行される場合があります。
詳細: Data Plus Science によるデータの高密度化に関するブログ投稿を参照してください。
欠落した値に関する予測を計算する
たとえば、将来の日付の予測を追加する必要がある場合があります。既定では、Tableau で欠落した値は表示されませんが、次の手順を実行して、これらのマークを生成できます。
日付ヘッダーまたはビン ヘッダーを右クリック (Mac では Control を押しながらクリック) します。
[欠落した値を表示] を選択します。
ただし、これだけでは生成されたマークに関する予測を行うのに十分ではありません。これらのマークに対して計算を実行しようとすると (予測計算かどうかに関係なく)、Tableau は NULL 値を返します。これらのマークは存在しない欠落値に基づいているため、これは予期された動作です。
これらの欠落した値に関する予測を行うには、上部の [分析] メニューを開き、[欠落した値のプロパティを推測] を選択します。
生成されたマークに関する予測の例
ここで、この動作について詳しく説明します。[欠落した値を表示] と [欠落した値のプロパティを推測] の設定のどちらかまたは両方がオン/オフになっているかどうかに応じて、ビジュアライゼーションにどのような影響があるかを示した 3 つの図を比較します。続けるには、Tableau Public からワークブック「欠落した値に関する予測」をダウンロードします。
ATTR(DAY([Order Date])) を予測変数として使用した予測が含まれています。これはデータの最適な予測変数ではありませんが (不十分な予測を生成します)、この記事の目的に沿う形で、[欠落した値のプロパティを推測] の適切な図を示しています。
以下に示すように、各 Viz では、[行] シェルフに 4 つの同じメジャーが含まれています。
- 行 1:
SUM([Profit])
- 行 2:
RUNNING_SUM(SUM([Profit]))
- 行 3:
ATTR(DAY([Order Date]))
- 行 4:
MODEL_QUANTILE(0.5, SUM([Profit]),ATTR(DAY([Order Date])))
図 1
上の図では、[欠落した値を表示] と [欠落した値のプロパティを推測] の両方がオフになっています。これは、Tableau の既定の設定です。
[欠落した値のプロパティを推測] がオンで、[欠落した値を表示] がオフになっている場合、同じ Viz が表示されます。これは、[欠落した値のプロパティを推測] は、[欠落した値を表示] がオンになっていることに依存するためです。
図 2
上の図では、[欠落した値を表示] がオンで、[欠落した値のプロパティを推測] がオフになっています。既定の設定では、[欠落した値を表示] がオンの場合でも、[欠落した値のプロパティを推測] がオフになっています。
この状況では、欠落した値 の ATTR on DAY([Order Date]) の値は計算されないことに注意してください (行 3)。高密度化された日付の予測は生成されますが、行 3 に示すように実際の ATTR(DAY([Order Date])) を推測することができないため、すべての欠落した日付の予測は同じになります。事実上、これらのマークは、DAY([Order Date]) が NULL であるかのように計算されています。
図 3
この図では、[欠落した値を表示] と [欠落した値のプロパティを推測] の両方がオンであり、動作中の [欠落した値のプロパティを推測] 設定が示されています。
図に示されているように、ATTR(DAY([Order Date])) を推測できるため (行 3)、行 4 の予測で使用して、スムーズな予測曲線を生成することができます。