データの結合またはユニオン

Tableau Prep Builder でデータを組み合わせるために使用できる 2 つの方法があります。結合とユニオンです。

データの結合

分析するデータは多くの場合、特定のフィールドで関連付けられたテーブルの集まりで構成されています。結合は、共通のフィールド上の関連データを組み合わせる方法です。結合を使用したデータの組み合わせの結果は、データのフィールドを追加することによって通常は横方向に拡張されたテーブルです。

結合の操作は、フローの任意の場所で行うことができます。フローの早いところで結合すると、データ セットを理解し、注意が必要なエリアをすぐに明らかにするのに役立ちます。

結合を作成するには、次のいずれかを実行します。

  1. 次のいずれかの方法を使用し、2 つの表を結合します。

    • 少なくとも 2 つの表をフロー ペインに追加してから、関連する表を選択して [結合] オプションが表示されるまで他の表にドラッグするか、 アイコンをクリックしてメニューから [結合の追加] を選択します。

    • アイコンをクリックしてメニューから [結合の追加] を選択してから、他の入力を手動で結合に追加し、結合句を追加します。
    • : Tableau Prep Builder のバージョン 2019.1.3 以降では、表のリレーションシップが定義されており、関連フィールドを含む表に接続する場合、[結合の追加] を選択し、関連する表のリストから選択することができます。2 つの表の間のリレーションシップを構成するフィールドに基づき、Tableau Prep Builder により結合が作成されます。

      表のリレーションシップを含むコネクタの詳細は、インプット ステップでのデータの結合を参照してください。

    新しい結合ステップがフローに追加され、[プロファイル] ペインが更新されて結合のプロファイルが表示されます。

  2. 結合を確認して構成するには、以下を実行します。

    1. [結合結果のサマリー] を見直し、結合タイプおよび結合条件の結果として含まれているフィールドと除外されているフィールドの数を確認します。

    2. [結合タイプ] でベン図をクリックし、必要な結合のタイプを指定します。

    3. [適用した結合句] でプラス アイコンをクリックするか、既定の結合条件として選択したフィールドで、結合句を指定または編集します。結合条件で選択したフィールドは、テーブルと結合との間で共通しているフィールドです。

    4. 代わりに、[結合句の推奨事項] に表示されている推奨の結合句をクリックし、その句を適用した結合句のリストに追加することもできます。

結合結果の検査

結合プロファイルのサマリーには結合についてのメタデータが表示され、結合に期待するデータが含まれていることを検証するのに役立ちます。

  • 適用した結合句: 既定で Tableau Prep Builder は、結合されているテーブルに含まれる共通するフィールド名に基づいて、最初の結合句を定義します。必要に応じて結合句を追加・削除します。

  • 結合タイプ: 既定で、結合を作成する場合には、Tableau Prep Builder はテーブル間の内部結合を使用します。接続先のデータによっては、左結合、内部結合、右結合、外部結合を使用できる場合があります。

  • 結合結果のサマリー: 結合結果のサマリーは、結合のテーブルで含まれている値と除外されている値の配分を表示します。

    • [含める] バーをクリックすると、結合に含まれている結合プロファイルのデータを分離して表示できます。

    • [除外済み] バーをクリックすると、結合から除外されている結合プロファイルのデータを分離して表示できます。

    • [含める] バーと [除外済み] バーの任意の組み合わせをクリックし、データを累積的な観点から表示します。

  • 結合句の推奨事項: [適用した結合句] リストに追加するには、推奨される結合句の隣にあるプラス アイコンをクリックします。

  • [結合句] ペイン: [結合句] ペインでは、結合句の各フィールドの値を表示できます。結合句の条件を満たさない値は赤いテキストで表示されます。

  • [結合結果] ペイン: [結合結果] ペインに、変更する必要がある値が表示される場合、このペインでその値を編集できます。

結合に関する一般的な問題

データの結合後に期待した結果が表示されない場合は、フィールド値に対していくらかの追加クリーニングの実行が必要な場合があります。以下の問題があると、Tableau Prep Builder で値が一致していないと読み込まれ、結合から除外されます。

  • 大文字化が異なる: "My Sales" と "my sales"

  • スペルが異なる: "Hawaii" と "Hawai'i"

  • ミススペルやタイポ: "My Company Health" と "My Company Heath"

  • 名前の変更: "John Smith" と "John Smith Jr."

  • 略語: "My Company Limited" と "My Company Ltd"

  • 余分な区切り: "Honolulu" と "Honolulu (Hawaii)"

  • 余分なスペース: 文字間の余分なスペース、タブ付きのスペース、先頭または末尾の余分なスペースを含む

  • ピリオドの使用不統一: "Returned, not needed" と "Returned, not needed."

幸いなことに、フィールド値にこれらの問題のいずれかが含まれる場合、[結合句] でインラインで直接フィールド値を修正するか、[結合結果のサマリー] の [除外済み] バーをクリックして除外済みの値を操作し、プロファイル カード メニューでクリーニング操作を使用することができます。

結合ステップで利用可能な別のクリーニング オプションの詳細については、クリーニング操作の適用を参照してください。

一致しないフィールドの修正など

結合句で直接、一致しないフィールドを修正できます。修正の必要があるフィールドで、値をダブルクリックするか、その値を右クリックしてコンテキスト メニューから [値の編集] を選択します。データの変更内容は追跡され、結合ステップの [変更内容] ペインに直接追加されます。

また、[結合句] ペインで複数の値を選択して保持、除外、またはフィルターしたり、[結合結果] ペインで他のクリーニング操作を適用したりすることもできます。どのフィールドを変更するか、また変更が結合プロセスのどこで行われるかに応じ、結合の前または後に変更が適用され、修正された結果が得られます。

フィールドのクリーニングの詳細については、クリーニング操作の適用を参照してください。

データのユニオン作成

ユニオンとは、あるテーブルの行を別のテーブルに追加することによりデータを組み合わせる方法です。たとえば、あるテーブルの新しい取引を、別のテーブルの過去の取引リストに追加する必要があるかもしれません。ユニオンを作成するテーブルではフィールド数とフィールド名が同じであり、フィールドは同じデータ型であることを確認してください。

ヒント: パフォーマンスを最大化するには、単一のユニオンに対する入力数を最大でも 10 にします。10 個以上のファイルや表でユニオンを行う必要がある場合は、インプット ステップでファイルのユニオンを行ってみてください。このタイプのユニオンの詳細については、インプット ステップでのファイルおよびデータベース表のユニオン作成を参照してください。

結合のように、フローの任意の場所でユニオンの作成操作を使用できます。

ユニオンを作成するには、次を実行します。

  1. 最低 2 つのテーブルを [フロー] ペインに追加してから、関連するテーブルを選択し、他のテーブルに [ユニオン] オプションが表示されるまでドラッグします。 アイコンをクリックし、メニューから [ユニオンの追加] を選択することもできます。新しいユニオン ステップが [フロー] ペインに追加され、[プロファイル] ペインが更新されてユニオンのプロファイルが表示されます。

  2. テーブルをユニオン テーブルに、[追加] オプションが表示されるまでドラッグし、追加テーブルをユニオンに追加します。

  3. ユニオンのプロファイルで、ユニオンについてのメタデータを確認します。ユニオンからテーブルを削除するほか、一致しないフィールドについての詳細を表示することもできます。

ユニオン結果の検査

ユニオンの作成後、ユニオンの結果を検査し、ユニオンに含まれるデータが期待通りのものであることを検証します。ユニオンのプロファイルには、ユニオンのデータを確認して検証するのに役立ついくつかのエリアがあります。

  • ユニオンのメタデータの確認: ユニオンのプロファイルには、ユニオンに関するメタデータがいくつか表示されます。ここで、ユニオンを構成する各テーブル、その結果生じるフィールド数、一致しないフィールドの存在を確認できます。

  • 各フィールドの上の色の確認: ユニオンのサマリーに一覧表示される各フィールドの隣、およびユニオンのプロファイルにある各フィールドの上には、一連の色が表示されます。色はユニオンの各テーブルと対応しています。

    対象のフィールドについてすべてのテーブルの色が表示される場合は、ユニオンがそのフィールドで正しく実行されています。テーブルの色が欠落している場合は、不一致のフィールドがあることを示しています。

    不一致のフィールドとは、類似のデータを持ちながら、何らかの点で異なるフィールドです。一致しないフィールドの一覧、そのソースであるテーブルを、ユニオンのサマリーで確認できます。フィールドのデータを詳細に確認したい場合は、ユニオンのプロファイルで [不一致のフィールドのみ表示] のチェックボックスを選択し、不一致のフィールドを分離します。

    以下の「一致しないフィールドの修正」セクションの提案のいずれかに従えば、これらのフィールドを修正できます。

一致しないフィールドの修正

ユニオンのテーブルが一致しない場合、ユニオンにより追加のフィールドが生成されます。追加のフィールドは、適切なコンテキストから除外されている有効なデータです。

フィールド不一致の問題を解決するには、不一致のフィールドを一緒にマージする必要があります。

フィールドが一致しないいくつかの理由の可能性があります。

  • 対応しているフィールドの名前が異なる: テーブル間で対応しているフィールドの名前が異なる場合、ユニオンの提案を使用するか、[不一致のフィールド] リストでフィールドを手動でマージするか、ユニオンのプロファイルでフィールド名を変更して不一致のフィールドを一緒にマージすることができます。

    ユニオンの提案を使用する場合は次の作業を行います。

    1. [不一致のフィールド] リストで不一致のフィールドをクリックします。一致の提案がある場合、一致するフィールドが黄色くハイライト表示されます。

      一致の提案は、類似のデータ型とフィールド名を持つフィールドに基づいて行われます。

    2. ハイライト表示されたフィールドにカーソルを合わせてプラス ボタンをクリックすると、各フィールドがマージされます。

    [不一致のフィールド] リストで手動でフィールドをマージする場合は、次の作業を行います。

    1. リストから 1 つまたは複数のフィールドを選択します。

    2. マージが有効である場合、選択したフィールドを右クリックすると [フィールドのマージ] メニュー オプションが表示されます。

      フィールドを右クリックした際に [利用できるオプションがありません] が表示された場合は、マージできるフィールドではありません。例えば、同じ入力が元となる 2 つのフィールドをマージしようとするとこれが表示されます。

    3. [フィールドのマージ] をクリックすると、選択したフィールドがマージされます。

    ユニオンのプロファイルペインでフィールド名を変更する場合は、フィールド名を右クリックしてさらに [フィールド名の変更] をクリックします。


  • 対応しているフィールドの名前は同じだが型が異なる: 既定では、対応しているフィールドの名前が一致してもフィールドのデータ型が一致しない場合、Tableau Prep Builder はいずれかのフィールドのデータ型を変更し、互換性があるようにします。Tableau Prep Builder がこの変更を行う場合、マージされたフィールドの上部に [データ型の変更] アイコンで示されます。

    Change Data Type Icon

    Tableau Prep Builder により正しいデータ型が選択されない場合もあります。このような状況でマージを元に戻す場合は、[データ型の変更] アイコンを右クリックし、[異なるタイプの入力を区切る] を選択します。


    その後、いずれかのフィールドのデータ型を最初に変更し、フィールドをマージする際のその他のオプション の提案を使用してフィールドをマージすることができます。

  • 対応しているテーブルのフィールド数が異なる: テーブルのユニオンを作成するには、ユニオンの各テーブルに同じ数のフィールドが含まれている必要があります。ユニオンの作成により追加のフィールドが生成される場合には、そのフィールドを既存フィールドにマージします。

フィールドをマージする際のその他のオプション

前述のセクションで説明したフィールドをマージする方法だけでなく、次のいずれかの方法でフィールドをマージすることもできます。フィールドのマージは任意のステップで行うことができますが、出力ステップは例外です。

同じファイルのフィールドをマージする方法については、フィールドのマージを参照してください。

フィールドをマージするには、次のいずれかを実行します。

  • 1 つのフィールドを別のフィールドにドラッグ アンド ドロップします。[マージ フィールドにドロップする] インジケーターが表示されます。

  • 複数のフィールドを選択し、選択項目内で右クリックしてコンテキスト メニューを開いてから、[フィールドのマージ] をクリックします。

  • 複数のフィールドを選択し、コンテキスト依存のツールバーで [フィールドのマージ] をクリックします。

ご意見をお寄せくださりありがとうございます。 ご意見の送信中にエラーが発生しました。もう一度実行するか、当社にメッセージを送信してください