高度なリレーションシップを使ってみる
リレーションシップの性質上、フィールドの由来やそのドメインおよび Null が表す内容を理解することがこれまで以上に重要です。[データ ソース] ページや [データ] ペインにアクセスせずに Viz を表示した場合にそれを正しく解釈するには、作成者が提供するタイトルやその他の情報が手がかりになるという点に注意してください。
注: 関係を使用するデータ ソースの基本的な動作にまだ慣れていない場合は、このトピックに進む前に関係を気軽に使ってみるを参照してください。
すべての日付フィールドが等しくないのはなぜですか?
2 つのフィールド名に "日付" という単語が含まれていても、それらのフィールドの内容が同じというわけではないことに注意してください。年のレベルに関する例を見てみましょう。つまり、月や日付の値は無視して、フィールドがどの年を範囲に入れているかに注目します。
Bookshop データ セットには、日付のデータ型を持つ複数のフィールドがあります。
- 生年月日
- 出版日
- 発売日
- また、受賞年と創立年には日付情報も含まれますが、それらは数値フィールドです。
- NB: [データ] ペインのアイコンが緑の場合、このフィールドが連続していることを示します。[データ] ペインで [フィールド名] を右クリックして、[不連続に変換](新しいウィンドウでリンクが開く) を選択します。アイコンが青に変わります。必要に応じて、“受賞年” と “創立年” でもこれを行います。
ただし、ドメイン (各フィールドの値) は異なります。各フィールドを行のシェルフに順番に移動します。その際、左下隅のマークの数を確認して各フィールドを削除してから、次のフィールドを移動します。
- 年 (生年月日) にある 27 個のはマークは、ドメインに 27 の異なる年が含まれていることを示します。
- 年 ([出版日]) にはマークが 15 個あり、ドメインは 15 年で構成されています。
- 受賞年にはマークが 11 個あります
- 創立年にはマークが 4 個あります
- 年 ([発売日]) にはマークが 1 個あります
ドメインのこうした違いに留意することが非常に重要です。年 ([出版日]) にあるエディションと賞のテーブルを受賞年に関連付ける場合、内部結合の分析をさらに掘り下げて、受賞年のみに絞り込むことができます。その結果、受賞年に該当しない書籍はすべて除外されます。(これは、受賞歴のない書籍をフィルターすることとは異なることに注意してください。書籍の受賞年に出版された書籍は、受賞歴がなくても除外されません。完全に除外されるのは、受賞年に該当しない書籍です。結合からのフィルター アクションは、書籍ではなく年のレベルにあります)。
例: 出版日と生年月日
[出版日] を [列] に、[生年月日] を [行] に設定すると、Abc のテーブルが表示されます。ワークブックをダウンロードして、このテーブルの詳細を確認してください(Tableau Desktop 2020.2 以降が必要です)。
このテーブルには空白が多く含まれています。出版年 2180 年と生年月日の年 2133 年が交差するところにはプレースホルダーがありません。つまり、2133 年に生まれた著者が 2180 年に出版しなかったということです。
それは確かですが、なぜそれが重要なのでしょうか?
たとえば、経時的な分析をしようと考えているとします。ハードカバーの売上は時間の経過とともに増加しているでしょうか? その場合、形式をハードカバーのみにフィルターし、行に売上 (カウント)、列に日付があるタイムラインとしてのグラフを想像するでしょう。しかし、使用するのはどの日付フィールドでしょうか? 出版日、生年月日、発売日も必要です。これらのフィールドにはわかりやすい名前が付いているので、発売についての質問は通常、「発売日」を使用します。ただし、すべてのデータ セットに明確な名前が付いているわけではありません。フィールドが "Date1" や "Date3" のような場合は、見分けるのはかなり難しくなります。分析的な質問が明確に考慮されていない場合は特に難しくなります。
フィールドが属するテーブルや、フィールドのドメインが表す内容は、分析に重大な影響を与えます。
日付フィールドを変更すると、分析を完全に変更することができます。次の 2 つの Viz を見てみましょう。
1 つ目は、「各年に生まれた著者が執筆した書籍数」と解釈することができます。ここでは、「著者の年齢が高いほど執筆した書籍数も多いか?」(いいえ)という質問や、「最も多くの作品を残した著者は何年に生まれたか?」(2155 年) といった質問をします。
2 つ目は「毎年何冊の書籍を出版したか?」と解釈することもできます。ここでは、「最も多くの書籍を出版したのは何年か?」(2188 年) という質問や、「書籍の出版は時間の経過とともに安定しているか?」(いいえ) といった質問をします。
生年月日を使用する Viz では、概念の組み合わせが扱いにくく、質問の仕方が難しくなります。しかし、Tableau では質問の良し悪しが判断されることはなく、意図するかしないかにかかわらず、どんな質問でも尋ねることができます。これは重要な点です。Date1 を使用すべきところで Date 3 を引き出しても、Tableau に Viz が表示されます。しかし、すべての日付フィールドが同じ意味を持つわけではないので、分析を正確に行うためにどのフィールドを使用するかは作成者の判断となります。
フィールドが属しているテーブルの重要性について詳しくは、このブログ投稿(新しいウィンドウでリンクが開く)を参照してください。
データが欠落しているとはどういう意味ですか?
ゼロと Null には違いがあります。
ゼロは、測定した結果、それが存在しないことを意味します。その値はもちろんゼロです。ゼロという値のスピード違反のチケットを持っているとしたら、おそらくあまりスピードは出ていないでしょう。
- NB: 0 と 1 は、多くの場合 True/False、はい/いいえ、合格/失敗など、他の二項値と同じ意味で使用されます。この場合、ゼロは数値ではなくラベルとして使用されます。
Null は、測定していないか、データを記録していなかったため、値がわからないことを意味します。運転記録でスピード違反のチケットの欄が単に空白になっていても、スピード違反をしたことがあるかどうかはわかりません。
Null は、データが欠落しているか、データが存在しないことを表します。
- 運転記録でスピード違反のチケットの値が Null の場合でも、記録されていないスピード違反のチケットがある可能性もあります。つまり、データが欠落していると仮定する必要があります。
- 存在しないデータは N/A として記録される可能性がありますが、不可能な事柄は追跡する必要がないため、単に記録されないことがよくあります。バスに乗っている間、スピード違反のチケットを何枚もらいましたか? そのデータはデータ セットに存在しない可能性があります。「交通手段」と「スピード違反のチケット」のマトリックスには、意味をなさない組み合わせがあります。その場合、データが存在しないものと見なされる場合があります。
Null が意味をなす場合
Null が真に未知のもの (スピード違反のチケット数に関する情報の欠如) であるか、存在しないデータ (バスの乗客がスピード違反のチケットをもらうことについての情報の欠如) を表しているかどうかを認識するには、データの知識が必要です。データに十分な信頼性があり、情報の欠如はデータの欠落ではなく存在しないデータによるものとみなすことができるか? 主題の専門知識を適用すると、Null が意味をなすようになります。
Abc のテーブルをもう一度見てみましょう。プレースホルダーを使用しなくてもスペースを分析することができます。このデータの信頼性は高く、Null は不完全なデータではなく存在しないデータであると仮定します。
プレースホルダーがない場合、その年にある著者が生まれ (行が存在する)、その年にある書籍が出版された (列が存在する) が、出版された書籍はその年に生まれた著者が執筆したものではない (セルは空) ことを示します。その空のスペースに、「出版なし」という意味のあるラベルを割り当てることもできます。さらに、これらの Null 値の分析を行うこともできます。たとえば、データに存在する日付の場合、書籍を出版せずに何年経過しているかを著者ごとに表示することができます。
注: 生年月日の領域にもギャップがあります。2131 年と 2132 年に生まれた著者がいない場合、年の範囲は 2130 年から 2133 年となります (2131 年と 2132 年の行は存在しない)。これらの欠落した年は、「このデータ セットには、その年に生まれた著者が執筆した書籍は含まれていない」と解釈することができます。ただし、上記のように日付フィールドのドメインについて説明する場合、ドメインに欠落した値があるということは、リレーションシップを構築する際や、Viz 内のヘッダーまたは軸に使用するフィールドを選択する際に考慮すべき重要な情報です。
リレーションシップでの Null の操作の詳細については、このブログ投稿(新しいウィンドウでリンクが開く)を参照してください。
実践練習
各 Viz のタイトルを付けてみましょう。平易な言葉で内容を説明してください。ライブ Viz を探索するには、ワークブックをダウンロードしてください(このワークブックでは、Bookshop データ セットを微調整したバージョンを使用し、2 つのテーブルのみを使用します。日付フィールドは、関連フィールドとして使用できるように調整されています)。
Viz のマトリックスの読み方
- 年間のエディション数 (紫色) と受賞数 (緑) が棒で表示されます。
- 各列の軸の日付フィールドは異なります。左側の列はエディション テーブルからの [出版年]、中央の列は賞テーブルからの [受賞年]、右側の列は [出版日] を使用した計算フィールドですが、そのフィールドが Null の場合は、[受賞年] を使用します (この計算は両方のドメインが完全に表示されるようにするために使用します)。
- 行ごとに賞とエディションのテーブルを組み合わせるリレーションシップが異なります。一番上の行は書籍 ID のテーブルに関連付けられ、中央の行は年に関連付けられ、下の行は書籍 ID と年の両方に関連付けられています。
- 2183 年を示す棒は、比較しやすくするために太くなっています。以下のソリューションでは、その年の値の詳細を確認できます。
- 網掛けされた 2 つの Viz の値が同じであることに注意してください。
行き詰ってしまった場合
Viz の各部分を手順を追って確認します。データ ソースの構造、軸とヘッダー、マークに使用するフィールド (およびどのテーブルに属しているか) を確認します。なぜそこに Null があるのかを考えてみてください。特定のマークや 2 つのマークのデータを表示し、どのレコードが含まれているかを確認します。
- データ ソースは、書籍 ID のエディションに関連している賞です。
- 日付軸は出版年です。
- 値は受賞数とエディション数です。
Viz で単一のマークを選択し、それを定義してください。2183 年の Viz は、エディション数が 7 で受賞数が 3 であることを示しています。参照元データの表示を参考にして、各マークにどのレコードが表示されているかを調べます。
エディション
賞
これらを組み合わせると、「2183 年に出版された 7 冊の書籍を返し、それらの書籍について受賞年に関係なく受賞した賞をすべて一覧表示する」と解釈することができます。TM925 は 2179 年に初めて出版され、ハードカバー版はその年に 2 つの賞を受賞しました。2183 年には、もう 1 つのエディション (おそらくペーパーバック版) が出版されました。受賞数の値は、年ではなく書籍に関連付けられています。
Viz 全体では、「各年に出版されたエディション数と、その年に出版された書籍の書籍別受賞数」または「各年に出版されたエディション数とそれらの書籍の受賞数」と解釈することができます。
2183 年 (太い棒) は解釈に焦点が置かれている年です。エディションに関する情報は紫色で、賞に関する情報は緑色で表示されています。2187 年は、受賞はしていないものの書籍が出版された年であるため、説明が記載されています。このように、軸に使用する日付フィールドによって得られる結果が図でわかりやすく示されています。このニュアンスは、青色で記載されています。リレーションシップの設定に使用するフィールドの重要性は、ピンク色で記載されています。
こうしたビジュアルは、ユーザーの便宜を図るために提供されていますが、ユーザー エクスペリエンスをさらに向上させるには、ワークブックをダウンロードし、それを Tableau Desktop 2020.2 以降で開くと、ツールヒントやデータの表示といったインタラクティブな機能を利用できるようになります。シートの詳細を確認する場合は、下部にあるいずれかのダッシュボードタブを右クリックして [すべてのシートの再表示] を選択します。これにより個々の Viz がすべて使用可能になり、各シートからは、どのフィールドがどのシェルフにあるかなど、[データ] ペインと作成環境を確認できます。3 つの異なるリレーションシップ (上記のマトリックスの行) を達成するには、3 つの異なるデータ ソースがあることに注意してください。
関連リソース
ちょっと難しいと感じたら、関係を気軽に使ってみるを試してください。
次のレベルに行く準備ができたら、リレーションシップで計算を気軽に使ってみるに進んでください。
製品管理チームが発信する関係の技術的基盤の詳細については、Tableau のブログのリレーションシップに関する連載を参照してください。
- 関係 (パート 1): Tableau に新しいデータ モデリングを導入する(新しいウィンドウでリンクが開く)
- 関係 (パート 2): ヒントとテクニック(新しいウィンドウでリンクが開く)
- 関係 (パート 3): 複数の関連するテーブルを横断して質問する(新しいウィンドウでリンクが開く)
また、「Tableau が関係を発明した理由(新しいウィンドウでリンクが開く)」など、Action Analytics(新しいウィンドウでリンクが開く) からの関係に関するビデオ ポッドキャストも参照してください。詳細については、ライブラリ(新しいウィンドウでリンクが開く)の [ビデオ ポッドキャスト] をクリックしてください。