関係を気軽に使ってみる

新しいデータモデリング機能を使用すると、リレーションシップを中心に構築された柔軟なデータソースを作成できます。

リレーションシップでは、異なるテーブルの共通する列 (フィールド) を調べ、その情報を使用して各テーブルの情報を分析で集めることで、それらのテーブルのデータを組み合わせます。

リレーションシップは結合やユニオンとは異なり、複数のテーブルを 1 つのテーブルに平坦化することなくデータソースを形成します。それで、関連するデータソースでは、各フィールドの由来がどのテーブルであるかがわかります。つまり、各フィールドでは、そのコンテキスト、すなわち詳細レベルを保持しています。したがって、関連するデータソースでは、重複やデータの消失という問題が生じることなく、異なる粒度のテーブルを処理することができます。

関連するデータソースでは、結合は初めから設定されていません。すべてのデータをマージするのではなく (また、それぞれの Viz で何を必要としているかにかかわらずすべてのデータを操作する必要があるのではなく)、関連するデータのみが、必要に応じてシートごとに組み合わされます。ドラッグアンドドロップすると、Tableau で関連するフィールドとテーブルのリレーションシップが評価されます。これらのリレーションシップを使用し、正しい結合の種類、集計、Null の処理を含むクエリを作成します。

データの組み合わせ方法や、データソースのアーティファクトの補正方法を考えるのではなく、データの適合方法やどのような質問の回答を得たいかについて考えることができます。

リレーションシップは、従来のデータの結合方法 (結合、ユニオン、ブレンド) に取って代わるものではありません。むしろ、リレーションシップは複数のソースのデータをまとめる新しい柔軟な方法です。既存の方法も残り、それらは引き続き特定のシナリオで役立ちます。

注: リレーションシップクエリのしくみについては、Tableau の次のブログ投稿を参照してください。

また、「Tableau が関係を発明した理由(新しいウィンドウでリンクが開く)」など、Action Analytics(新しいウィンドウでリンクが開く) からの関係に関するビデオポッドキャストも参照してください。詳細については、ライブラリ(新しいウィンドウでリンクが開く)の [ビデオポッドキャスト] をクリックしてください。

リレーションシップを使用する

このトピックでは、関連するデータソースの構築とそれを使用した分析について取り上げます。手順に従って進めたい場合は、Bookshop データセットをダウンロード(新しいウィンドウでリンクが開く)することができます。生データで最初から開始するには Bookshop.xlsx を選択し、関連するデータソースの構成済みの基本的な内容を使用して開始するには MinimalBookshop.tdsx を選択します。

注: リレーションシップは、Tableau 2020.2 以降でサポートされています。

ビデオ: 移行済みデータ

Tableau 2020.2 以降を使用して以前の Tableau バージョン (2020.1 以前) から既存のワークブックを開くと、[データソース] タブに [移行済みデータ] テーブルが表示される場合があります。

このトピックには複数のビデオが埋め込まれています。なお、各ビデオ下部の展開可能セクションには、トランスクリプトをご用意しています。

移行済みデータのビデオトランスクリプト

ビデオ: パフォーマンスオプション

注: このビデオで示されている関係を編集するためのインターフェースは、現在のリリースとは少し異なりますが、同じ機能を備えています。

パフォーマンスオプションのビデオトランスクリプト

詳細については、カーディナリティと参照整合性を参照してください。

例: 書店データ

ここから少し、このデータソースを使用して分析を行っていき、データについてお話しします。

データセットは (架空の) 書籍に関するもので、書籍と版の区別を考慮することが重要です。書籍とは、それ自体がタイトル、著者、ジャンルなどの属性を持つ概念的な作品のことです。また、書籍には版もあり、ISBN で識別される価格や形式 (ハードカバーやペーパーバック) などの属性があります。書籍の版には出版社とページ数が含まれますが、書籍には受賞歴がある場合やシリーズに含まれる場合があります。

MinimalBookshop.tdsx をダウンロードして順に進めていくか、冒険心を持って Bookshop.xlsx から自分でモデルを構築することができます。テーブルを組み合わせると、ID フィールドの多くを非表示にすることができます。

書籍データのデータベーススキーマ。

ビデオ: 複数のテーブルを操作する

注: このビデオで示されている関係を編集するためのインターフェースは、現在のリリースとは少し異なりますが、同じ機能を備えています。

複数のテーブルを操作するのビデオトランスクリプト

ビデオ: 基本的な計算

基本的な計算のビデオトランスクリプト

ビデオ: セットとグループ

セットとグループのビデオトランスクリプト

関連データを分析する

リレーションシップ間や結合間で分析がどのような外観になるかを比較してみましょう。上記で使った自分自身のデータソースを使わずに、比較ワークブックをダウンロードすることをお勧めします。

質問: シリーズ本を出している著者では、最も多くのブックツアーイベントを開催しているのは誰ですか?

ビデオ: さまざまな詳細レベルを操作する

ビデオのトランスクリプト

どの著者を操作するかを見てみましょう。関連するデータソースを使用し、"Author Name (著者名)" と "Series Name (シリーズ名)" を [行] に移動します。

関連するデータソースでは、ディメンションのみを含むテーブル内の不一致データが減っているため、自分たちに関連するデータに焦点が当たっています。著者は 7 人で、そのうちの 2 人は 2 つのシリーズを書き下ろしたことがわかります。一致する値のみを表示しない場合は、[分析] メニュー > [テーブルのレイアウト] に移動し、[空の行を表示] にチェックを入れると、一致しない値を復元することができます (従来の動作と似ています)。

関連

結合

関連するデータソースを使用する:

"Book (書籍)" のテーブルから "In a series (シリーズの一部)" のセットを [フィルター] シェルフに移動します。既定では、セット内のメンバーのみにフィルター処理が適用されます。
"Author Name (著者名)" を [行] に移動します。
"Book Tour Events (書籍ツアーイベント)" を [列] に移動します。

結合データソースを使用する:

"In a series (シリーズの一部)" のセットを [フィルター] シェルフに移動します。
"Author Name (著者名)" を [行] に移動します。
"Book Tour Events (書籍ツアーイベント)" を [列] に移動します。

ここで、数字に少しずれがあるようです。

結合データでは、結合のために重複が生じ、一部の著者には複数のシリーズがあることもわかっています。このため集計を、たとえば MIN や MAX に変更することはできません。複数のシリーズの作品がある著者で情報が失われるためです。

本当に必要としているのは、著者ごとに視覚化された、シリーズあたりのイベント数です。これは、詳細レベル (LOD) 表現の典型的な事例です。以下により "Series Events (シリーズイベント)" の計算を作成します。

{FIXED [Series Name] : MIN ([Book Tour Events])}

MIN は単一シリーズのイベントの重複を処理するためのものです。

この新しいフィールドを元のイベントフィールドではなく [列] に移動すると、正しい値が得られます。

関連データについては、それを実行する必要はありませんでした。リレーションシップは、ネイティブの詳細レベルや、"Author (著者)" テーブルを "Book (書籍)" テーブルや "Info (情報)" テーブル、"Series (シリーズ)" テーブルに関連付ける方法を理解したり、"Events (イベント)" メジャーを "Author Name (著者名)" に適切に再度結合して集計したりするための賢い方法で、どれも LOD 計算を記述する必要はありません。

それで、データの関連付けを敬遠しないでください。ご自分で確かめてください! Bookshop データをダウンロード(新しいウィンドウでリンクが開く)するか、ご自分のデータを使用することができます。フィルター処理、表計算の使用、さまざまなチャートタイプの構築、パフォーマンスオプションの構成、リレーションシップの作成をできるだけ試してみてください。

このセクションの他の記事

一番上に戻る

Tableau Desktop と Web 作成のヘルプ