データのブレンド

適用先: Tableau Cloud, Tableau Desktop, Tableau Server

データブレンドは、複数のソースからのデータを組み合わせる方法のひとつです。セカンダリデータソースからの追加情報が取り込まれ、プライマリデータソースからのデータと共にビューに直接表示されます。

データブレンドは、ブレンドの関係 (リンクフィールド) をシート単位で変更する必要がある場合や、パブリッシュされたデータソースを結合する場合に特に便利です。

データ結合のオプション

データの組み合わせ方法は数多くありますが、それぞれに長所や短所があります。

リレーションシップは既定の方法であり、詳細レベルが異なるテーブルを含め、ほとんどのインスタンスで使用できます。関係には柔軟性があり、シート単位での分析構造に適応できます。ただし、パブリッシュされたデータソース間の関係を作成することはできません。

結合は、類似する行構造にデータの列を追加することによりテーブルを組み合わせます。ただし、テーブルが異なる詳細レベルである場合はデータが失われたり、重複することがあるため、分析を開始する前に結合を確立させる必要があります。パブリッシュされたデータソースを結合で使用することはできません。

ブレンドは、関係や結合とは異なり、データを直接組み合わせることはしません。ブレンドは各データソースに対して個別にクエリを実行し、その結果を適切なレベルに集計して、すべての結果をビューに視覚的に表示します。これにより、ブレンドはさまざまなレベルの詳細に対応し、パブリッシュされたデータソースを処理することができます。ブレンドは、ブレンドされたデータソースを新たに作成するわけではありません (したがって、「ブレンドされたデータソース」としてパブリッシュすることはできません)。これらは単に、シートごとにブレンドした結果を視覚化したものです。

データブレンドの手順

データブレンドはシート単位で実行され、2 番目のデータソースのフィールドがビューで使用されるときに確立されます。

ワークブックでブレンドを作成するには、少なくとも 2 つのデータソースに接続する必要があります。次に、フィールドを 1 つのデータソースからシートに移動します。これがプライマリデータソースになります。別のデータソースに切り替え、1 つのフィールドを同じシートで使用します。これがセカンダリデータソースになります。リンクアイコンがデータペインに表示され、データソースのブレンドに使用されているフィールドを示します。

ワークブックに複数のデータソースがあることを確認してください。2 番目のデータソースは、[データ] > [新しいデータソース] から追加する必要があります。
Tip: ブレンドには、データペインに個別に表示される複数の異なるデータソースが必要です。最初のデータソースに別の接続を追加すると、[データソース] ページで関係と結合が有効になります。
フィールドをビューにドラッグします。このデータソースがプライマリデータソースになります。
別のデータソースに切り替え、プライマリデータソースに対するブレンドの関係があることを確認します。
- リンクフィールドアイコン () がある場合、そのデータソースは自動的に関連付けられています。少なくとも 1 つのアクティブなリンクがある限り、データをブレンドできます。
- 破損リンクアイコン () がある場合は、2 つのデータソースをリンクするフィールドの横にあるアイコンをクリックします。スラッシュが消え、アクティブなリンクになります。
- 目的のフィールドの横にリンクアイコンが表示されない場合は、ブレンドするリレーションシップを定義するを参照してください。
セカンダリデータソースからフィールドをビューにドラッグします。

この 2 番目のデータソースが同じビューで使用されると、ブレンドがすぐに確立されます。以下の例では、プライマリデータソースは [Movie Adaptations (映画版)] で、セカンダリデータソースは [Bookshop (本屋)] です。

プライマリデータソースはデータソース上の青色のチェックマークで示されます。ビューで使用されているプライマリデータソースのフィールドにはマークがありません。
セカンダリデータソースは、データソース上のオレンジ色のチェックマークとデータペインの横のオレンジ色のバーで示されます。ビューで使用されているセカンダリデータソースのフィールドにはオレンジ色のチェックマークがあります。

「本が長いほど映画も長くなるか?」というタイトルで、映画の長さとページ数を比較した散布図グラフを表示するダッシュボード。

プライマリデータソースとセカンダリデータソースを理解する

データブレンドには、1 つのプライマリデータソースと 1 つまたは複数のセカンダリデータソースが必要です。ビューで使用される最初のデータソースはプライマリデータソースになり、ビューを定義します。これにより、セカンダリデータソースからの値を制限して、プライマリデータソースに対応する一致があるセカンダリデータソースの値のみをビューに表示できます。これは左結合に相当します。

たとえば、プライマリデータソースの [Month (月)] フィールドに [April (4 月)]、[May (5 月)]、[June (6 月)] だけが含まれている場合、セカンダリデータソースに 12 か月分の値があるとしても、月に基づいて作成されたビューには [April (4 月)]、[May (5 月)]、[June (6 月)] だけが表示されます。必要な分析に 12 の月のすべてが関係する場合は、他方のデータソースを最初に使用してシートを再構築することにより、プライマリデータソースを切り替えてみてください。

詳細情報: データソースの順序の影響

ブレンドされたデータソース全体の処理

データブレンドの性質により、ブレンドされたデータソースで作業する場合に考慮する必要のある点がいくつかあります。

複数のデータソースのフィールドを使用した計算の実行は、通常の計算とは若干異なる可能性があります。計算は単一のデータソースで作成する必要があります。計算エディターの上部には、計算の対象となるデータソースが示されます。

集計。別のデータソースから使用されるフィールドには集計 (既定では SUM) が付いていますが、これは変更できます。計算では集計引数と非集計引数を組み合わせることができないため、計算のホストデータソースのフィールドも集約する必要があります。(以下の画像で、SUM 集計は自動的に追加され、sum 集計は手動で追加されました)。
ドット表記。計算で参照されるフィールドのうち、他のデータソースに属するものは、ドット表記を使用してそのデータソースを参照します。(以下の画像で、[サンプル - スーパーストア] 用に作成された計算では、[Sales Target (売上目標)] フィールドは [Sales.Targets].[Sales Target] になります。計算が [Sales Targets (売上目標)] で作成される場合、[Sales (売上)] フィールドは [サンプル - スーパーストア].[Sales] になります)。

これらは、各データソースで作成される同じ計算の等価バージョンです。どちらの場合も、これは SUM(Sales) / SUM(Sales Target) です。

売上目標の割合を計算する数式の計算ウィンドウ。

計算が少し異なる方法で処理されることに加えて、セカンダリデータソースにはいくつかの制限があります。セカンダリデータソースのフィールドによって並べ替えができなかったり、アクションフィルターがブレンドされたデータで予期したとおりに動作しなかったりする場合があります。詳細については、その他のデータブレンドの問題を参照してください。

ブレンドするリレーションシップを定義する

Tableau で複数のソースからのデータの組み合わせ方法が認識されるようにするには、データソース間に共通のディメンションが必要です。この共通のディメンションはリンクフィールドと呼ばれます。セカンダリデータソースのデータペインでは、アクティブなリンクフィールドにはアクティブなリンクアイコン ( ブレンドリンクアイコン。 ) が表示され、リンクしている可能性のあるフィールドには破損リンクアイコン ( ブレンドリンクの壊れたアイコン。 ) が表示されます。リンクフィールドは、プライマリデータソースに表示されません。

たとえば、トランザクションデータと割り当てデータのブレンドでは、地理的フィールドをリンクフィールドとして使用すると、同じ地域の割り当てとそのパフォーマンスの両方を分析することができます。

注: ブレンドが機能するには、リンクフィールドで値またはメンバーを共有する必要があります。Tableau では、共有値に基づいてブレンドデータのビューが作成されます。たとえば、[Color (色)] が両方のデータソースのリンクフィールドの場合、プライマリの [Purple (紫色)] とセカンダリの [Purple (紫)] のデータがマッチングされます。しかし、[Lt. Blue (ライトブルー)] は正しく [Light Blue (ライトブルー)] にマッチングされないため、これらのいずれかの別名を変更する必要があります。Tableau がリンクフィールドを識別できるようにフィールドの名前を変更するのと同様に、これらのフィールド内のメンバーの別名を編集できます。詳細については、ビュー内でメンバー名を変更する別名を作成するを参照してください。

リンクの確立

プライマリデータソースとセカンダリデータソースでリンクフィールドの名前が同じ場合は、自動的にリレーションシップが作成されます。プライマリデータソースが確立されている (つまり、フィールドがビューで使用されている) 場合、データペインでセカンダリデータソースを選択すると、2 つのデータソース間で同じ名前を持つフィールドのセカンダリ データソースに、リンクアイコン ( ブレンドリンクアイコン。またはブレンドリンクの壊れたアイコン。 ) が表示されるようになります。プライマリデータソースの関連フィールドがビューで使用されている場合、リンクは自動的にアクティブになります。

セカンダリデータソースにリンクアイコンがない場合は、次の 2 つの方法のいずれかでリンクを確立しなければならない場合があります。

共通のディメンションが同じ名前ではない (たとえば、[Title (タイトル)] と [Book Title (本のタイトル)] である) 場合は、一方の名前を変更すると共通のディメンションとして識別され、リンクが確立されます。
または、プライマリデータソースとセカンダリデータソースのフィールド間のリレーションシップを手動で定義することができます。手動のリンクのリレーションシップを作成する方法について詳しくは、以下を参照してください。

アクティブなリンクフィールドやリンクしている可能性のあるフィールドは、必要なだけ作成できます。データペインで破損リンクアイコン ( ブレンドリンクの壊れたアイコン。 ) をクリックすると、関係がアクティブになります。

リンクのリレーションシップを手動で定義する

複数のリンク

リレーションシップや結合と同様に、データソース間のリンクが複数のフィールドによって定義されている場合があります。たとえば、地域の売上ノルマが月単位である場合、正しいデータがビューに取り込まれるように、地域と月の両方に基づいてトランザクション売上データと売上ノルマデータの間のブレンドを確立する必要があります。複数のリンクを同時にアクティブにできます。

詳細: 複数のリンクフィールドの影響

データを複数のフィールドに基づいてブレンドする際、それらのフィールドのデータの組み合わせが両方のデータセット間で一致する場合にのみ、値はビューに含められます。これを理解するための例を見てみましょう。

ここに 2 つのテーブルがあります。1 つはバードウォッチャーが実際に観察した鳥について、もう 1 つは観察が報告された鳥についてです。

3 人のバードウォッチャーが記録した鳥の観察記録の表。およびバードウォッチャーが観察した鳥類の種類、使用された証拠の種類、報告件数の表。

プライマリデータソース ([Birds seen (観察された鳥)]) のフィールド [Birdwatchers (バードウォッチャー)] および [Number of birds (鳥の数)] を含むブレンドビューを設定し、セカンダリデータソース ([Birds reported (報告された鳥)]) のフィールド [Number of reports (報告数)] を取り込むと、自動的に [Birdwatcher (バードウォッチャー)] に基づいてブレンドが実行されます。

棒グラフは、3 人のバードウォッチャーの鳥と報告の数を示しています。

バードウォッチャー A が 3 羽の鳥を観察して 2 件の報告を行い、B が 4 羽の鳥を観察して 1 件の報告を行い、C が 8 羽の鳥を観察して 2 件の報告を行ったことがわかります。

しかし、[Species seen (観察された種類)] もリンクフィールドとして使用できます。このフィールドでもブレンドを実行してみましょう。違いは生じるでしょうか。

棒グラフは、3 人のバードウォッチャーの鳥と報告の数を示しています。

かなり大きな違いが生じます。バードウォッチャー A と C による報告がそれぞれ 1 件だけになり、B は 0 件になりました。どういうことでしょうか。

報告された種と観察された種の間の相違を表示する表。

これらのバードウォッチャーがそれほど正直でないことが判明しました。日記の項目に基づいて観察内容を報告しただけのとき (上の画像にある青色のバー)、報告された種類は実際に観察された種類と一致しませんでした ([Birds seen (観察された鳥)] セカンダリデータソースの 2 番目の列が NULL になっていることに注目してください)。報告を写真で裏付けたとき (オレンジ色のバー)、その報告は正直でした ([Species seen (観察された種類)] の両方の列が一致します)。

3 つのレポートで種類が一致しなかったため、[Species seen (観察された種類)] がリンクフィールドとして使用されたときに、該当するデータ行が削除されました。ビューには、両方のリンクフィールドで値が一致するデータだけが表示されます。

Takeaway

複数のフィールドでリンクする場合は注意してください。アイコンをクリックしてアクティブなリンクを確立することは非常に簡単かもしれませんが、リンクフィールドが多すぎたり不適切だったりすると、分析に重大な影響が及ぶ可能性があります。

結合とデータブレンドの違い

データブレンドは、従来の左結合のシミュレーションを行います。2 つの主な違いは、集計が実行されるタイミングです。結合では、データが組み合わされてから集計されます。ブレンドでは、データが集計されてから組み合わされます。

左結合

左結合を使用してデータを組み合わせると、結合が実行されたデータベースにクエリが送信されます。左結合では、左のテーブルのすべての行と、右のテーブルでそれに対応する行が返されます。結合の結果は Tableau に返され、ビジュアライゼーションでの表示用に集計されます。

左結合では、左の表のすべての行が取得されます。共通の列は [User ID (ユーザー ID)] と [Patron ID (パトロン ID)] です。右の表に対応する情報がある場合は、そのデータが返されます。それ以外の場合は、NULL が入ります。

ユーザー ID、地区、レベル、タイプを示す表。青い円と白い円の 2 つの円があるベン図。ブランチ、利用者 ID、地区、レベルを示す表。等号アイコン。ユーザー ID、地区、レベル、ブランチ、タイプを示す表。

同じ表を使用しますが、順序を反転したとします。この新しい左結合の結果は異なります。今回も新しい左の表からはすべてのデータが取得されますが、右の表の行は基本的に無視されます。[User ID (ユーザー ID)] が 4 であるデータ行は、左の表に [Patron ID (パトロン ID)] が 4 である行がないため、含められません。

ブランチ、利用者 ID、地区、レベルを示す表。青い円と白い円の 2 つの円があるベン図。ユーザー ID、地区、レベル、タイプを示す表。等号アイコン。ユーザー ID、地区、レベル、ブランチ、タイプを示す表。

データブレンド

データブレンドを使用してデータを組み合わせる場合、シートで使用される各データソースのデータベースにクエリが送信されます。クエリの結果は集計されたデータとして Tableau に返され、ビジュアライゼーションでまとめて表示されます。

注: メジャーを集計することは簡単です。数値の合計、平均、最大値その他の集計を簡単に実行できます。メジャーの値は、ビューにおけるフィールドの集計方法に基づいて集計されます。ただし、セカンダリデータソースのすべてのフィールドが集計される必要があります。ディメンションの場合はどうでしょうか。ディメンション値は ATTR 集計関数を使用して集計され、セカンダリデータソースのすべての行に対して 1 つの値が返されます。これらの行に複数の値がある場合は、アスタリスク (*) が表示されます。これは、「ビューのこのマークについてセカンダリデータソースに複数の値がある」と解釈できます。

ビューはリンクフィールドに基づいて、プライマリデータソース (左の表として機能する) のすべての値と、セカンダリデータソース (右の表) の対応する行を使用します。

次の表があるとします。リンクフィールドが [User ID (ユーザー ID)] と [Patron ID (パトロン ID)] である場合は、次の理由により、一部の値が結果の表の一部にならない可能性があります。

左の表の行に対応する行が右の表にありません。これは結果で NULL 値によって示されます。
右の表の行に対応する値が複数あります。これは結果でアスタリスク (*) によって示されます。

ユーザー ID、地区、レベル、タイプを示す表。チェーンリンクアイコン。ブランチ、利用者 ID、地区、レベルを示す表。等号アイコン。ユーザー ID、地区、レベル、ブランチ、およびタイプ情報を示す表。

メジャーが関係する場合は、メジャーも次のように集計されます。

ユーザー ID、地区、レベル、タイプを示す表。チェーンリンクアイコン。テーブルの値がブレンドされることを示す矢印が付いた 2 つの表。等号アイコン。ユーザー ID、地区、レベル、タイプ、ブランチ、罰金を示す表。

重要: ブレンドされたデータを含むビュー内のアスタリスク (*) は複数の値を示します。これは、プライマリデータソースの各マークについて、セカンダリデータソースで一致する値を 1 つだけにする (プライマリデータソースとセカンダリデータソースを入れ替えることもできます) ことによって解決できます。詳細については、データブレンドのトラブルシューティングを参照してください。

データブレンドの概要

データブレンドはシート単位で行われます。
フィールドが使用される順序によって、どのデータソースがセカンダリデータソースに対するプライマリになるかが決まります。
プライマリデータソースは青色のチェックマークで示され、セカンダリデータソースとそのフィールドにはオレンジ色のチェックマークが付けられます。
リンクフィールドを共有フィールド名に基づいて自動的に決定するか、ブレンドのリレーションシップを手動で作成することができます。
データブレンドは左結合のように動作するため、セカンダリデータソースのデータが除外されることもあります。
アスタリスク (*) が表示される場合もあります。これは、1 つのマークで複数のディメンション値が存在することを示します。これが生じるのは、データブレンドでは集計された結果がビューで組み合わされるためです。
セカンダリデータソースを使用して、プライマリデータソース内のフィールド値に別名を付け直すこともできます。詳細については、データブレンドを使用してフィールドの値に別名を付けるを参照してください。

データブレンドの制限事項

COUNTD、MEDIAN、RAWSQLAGG などの非加算的な集計に関しては、一部のデータブレンドの制限があります。詳細については、データブレンドのトラブルシューティングを参照してください。
ブレンドされたデータソースを 1 つの単位としてパブリッシュすることはできません。代わりに、各データソースを個別に (同じサーバーに) パブリッシュした後、パブリッシュ済みデータソースをブレンドします。
セカンダリデータソースのデータは、常に計算で集計される必要があります。
キューブデータソースをブレンドする場合は、それがプライマリデータソースである必要があります。

このセクションの他の記事

一番上に戻る

Tableau Desktop と Web 作成のヘルプ