データ ソースの計画
Tableau の中心にあるのはユーザーのデータです。データの探索、質問への回答、ビジュアライゼーションの構築を自分や他のユーザーが正常に実行できるかどうかは、基礎となるデータによって変わります。
簡単な探索やアドホック分析を行うことを目的とする場合は、ホップ インしていくつかのデータに接続し、ドラッグ アンド ドロップしていくつかの viz を作成することができます。また、必要な情報を使用してホップ アウトすることも可能です。ただし、複数回使用する分析やデータ ソースを作成することが目的の場合は、データ ソース全体について考え、計画を立てることをお勧めします。
Tableau データ ソース
Tableau データ ソースは、ソース データと Tableau の間のリンクです。基本的には、データの合計 (ライブ接続や抽出)、接続情報、テーブルの名前やデータが含まれているシート、Tableau で動作するためにデータに基づいて作成するカスタマイズです。これらのカスタマイズには、データの組み合わせ方法や、計算、名前変更されたフィールド、既定の書式設定といったメタデータなどが含まれます。
Tableau データ ソース には、 異なるデータベースやファイルへの複数のデータ接続が含まれる場合があります。接続情報には、データが配置されている場所 (ファイル名、パス、ネットワークの場所など) や、データへの接続方法に関する詳細 (データベース サーバー名やサーバーのサインイン情報など) が含まれます。
注: データ ソースとデータ接続という用語はこれまで区別されずに使用され、古い資料では明確な区別が行われていませんでした。
また、Tableau データ ソース (Tableau によるデータへのアクセスと、関連する可能性のあるすべてのカスタマイズ) と、ソース データ自体 (データベースや Excel スプレッドシートなど) の違いについても念頭に置いておくことが重要です。データベースの設計という意味でのデータ ソースの計画については、このトピックの対象ではありません。
Tableau データ ソースは、最初に作成されたワークブックに埋め込まれたままにすることも、個別にパブリッシュすることもできます。パブリッシュされたデータ ソースでは、キュレーションされたデータ ソースの一元化やスケーリングが可能です。詳細については、パブリッシュされたデータ ソースのベスト プラクティスを参照してください。
Tableau データ ソースに関する考慮事項
まず、データ ソースの目的を明確にしてください。さまざまなユーザーからのさまざまな質問に回答するための、あらゆる状況に対応できるデータ ソースを作成する場合は、パフォーマンスを最適化するためのニッチなデータ ソースを構築する場合とは異なる方法で処理します。最初から目的を理解しておくことが重要です。
この目的を念頭に置いたうえで、Tableau でデータ ソースを構築する前に次のいくつかの項目について検討し、計画しておきます。
- 場所とアクセス
- 形状とクリーンさ
- データ モデルとデータの結合
- メタデータとカスタマイズ
- スケーラビリティ、セキュリティ、検出可能性
- パフォーマンスと最新度
場所とアクセス
データの場所は、コンピューター上の単一の Excel ファイルや作成した Google スプレッドシートのように単純なものから、さまざまな技術を駆使した複数のデータベースのような複雑なものまであります。Access には、特定のドライバー、データベースのコネクタ、データベース サーバーのログイン情報なども含めることができます。
考慮すべき質問:
- データと Tableau へのアクセス権やパーミッションを持つ、適切なユーザーですか?
- どのユーザー アカウントをデータベースへのログインに使用する必要がありますか?
- ユーザーのフィルターリングや行レベルのセキュリティは必要ですか?
- ソース データはオン プレミスですか、クラウドにありますか?
- サポートされるコネクタはありますか?
- そのデータベースに制限はありますか (使用するすべての機能に対応していますか)?
形状とクリーンさ
組織には、接続可能なよく構造化されたデータや、活用できる ETL プロセスが既に提供されている場合があります。また、Tableau Prep Builder を使用して、データを有用な形式にするためのクリーニング操作とシェイピング操作を実行する必要が生じる場合があります。
考慮すべき質問:
- データは Tableau で使用するためによく構造化されていますか?
- Tableau Prep Builder と Tableau Prep Conductor を使用して 、データの準備フローのクリーニングと自動化を行う必要がありますか?
- Tableau でネイティブに行う際に最適な計算や操作は何ですか?
- 不要なデータはありますか? 欠落しているデータはありますか?
データ モデルとデータの結合
Tableau では、データのクエリ方法を把握する必要があります。これは、Tableau データ モデルで説明されています。データが複数のテーブルから取得される場合は、組み合わせる必要があります。データを組み合わせる方法には、リレーションシップ、結合、ブレンドなどがあります。
考慮すべき質問:
- データは複数のシステムに分散されていますか?
- データの各テーブルを組み合わせるための最適な方法は何ですか?
メタデータとカスタマイズ
ユーザーが快適に使用できるような、簡単な方法でデータが保存されていないことがよくあります。たとえば、既定のフィールド名が使いづらい、カスタムの書式設定が必要、省略形やコードの定義が欠落している、基になるデータに共通の計算が存在しないといった場合があります。これらの情報が含まれるセマンティック レイヤーを作成すると、データをより簡単に理解できるため、使用しやすくなります。
考慮すべき質問:
- どのような計算を追加する必要がありますか?
- テーブルの名前やフィールド名はわかりやすいですか?
- フィールドの既定の設定は便利ですか、それともカスタマイズする必要がありますか?
- Tableau Catalog に対応するために行うべき調整はありますか?
この時点では、[データの説明] はマルチテーブル データ ソースに対応していません。
スケーラビリティ、セキュリティ、検出可能性
データ ソースは、作成したワークブック内 (埋め込みデータ ソース) にそのまま残るか、Tableau Server や Tableau Cloud の分析で所有するコンテンツ資産として独自にパブリッシュされます。パブリッシュされたデータ ソースの一元化に、セキュリティとスケーリングという利点が追加され、複数のユーザーが一貫性のあるデータ ソースにアクセスできるようになりました。また、パブリッシュされたデータ ソースは Tableau Catalog や推奨事項を活用して、組織に真の単一ソースを提供することもできます。
考慮すべき質問:
- データ ソースをワークブックに埋め込んだままにする必要がありますか?
(次の質問は、データ ソースがパブリッシュされていることを前提としています)
パフォーマンスと最新度
Tableau データ ソースをソース データへのライブ接続にすることも、データを更新可能な抽出としてコピーすることもできます。抽出により、分析のパフォーマンスが向上したり、データベース システムに対するリソースの枯渇を防いだりできます。
考慮すべき質問:
- データ接続をライブにしたり抽出したりする必要がありますか?
- 抽出した場合、更新スケジュールはありますか? (Tableau Server | Tableau Cloud)
- Tableau Cloud にパブリッシュされた場合、Tableau Bridge を使用する必要がありますか?
品質の高いデータ ソースを構築する
適切に設計されたパフォーマンスの高いデータ ソースには、多くの情報が含まれています。ただし、最初の試行をパブリッシュする必要はありません。優れたビジュアライゼーションを作成するように、データ ソースの構築は継続的なプロセスになります。必要なデータを組み合わせて、ニーズを満たす viz が構築できているかどうかを確認してみてください。いつでも戻って新しい計算を書き込んだり、別のデータ テーブルを取り込んだりすることができます。ユーザー テストを行い、同僚にフィールド名が理解できるかどうか尋ねてみてください。
もちろん、信頼できるデータ ソースのみをパブリッシュし、品質保証に合格したデータ ソースのみを認定することが最善です。データ ソースがユーザーの前に表示されるときまでに、信頼できるものに仕上げることが必要です。
データの組み合わせ
データを単一のテーブルから取得している場合は、データに接続してデータ ソースを作成し、テーブルをキャンバスにドラッグしてから、ビューの構築を開始できます。ただし、データが複数のテーブルやデータベースに分散している場合は、データを組み合わせる必要があります。データの結合は、[データ ソース] ページで行われます。
単一のデータベース | 複数のデータベース |
|
|
注: 異なるデータベース間でテーブルを関連付けるには、新しいデータ ソースではなく、同じデータ ソース内のデータ接続として追加する必要があります。データ接続は、左側のペインの [追加] リンクから追加されます。新しいデータ ソースは、[データ] メニュー、または下の図に示すように、[データ ソース] の名前の横にあるアイコンからドロップダウン メニューを使用して作成できます。
データの結合方法
リレーションシップは、Tableau でデータを組み合わせる既定の方法です。関係は、複数のテーブルのデータを分析用に組み合わせる動的で柔軟な方法です。必要に応じて、テーブルを結合したりユニオンしたりすることもできます。データ ソースをブレンドすることも可能です。Tableau でデータを組み合わせる方法についてのオプションと、各方法が有用となる状況について見ていきます。
関係 | 関連フィールドに基づいて、2 つのテーブル間の結合の可能性を確立します。固定されたテーブルを新規作成するために、データをマージしないでください。分析中に、コンテキストに応じた適切な結合を使用して関連テーブルを自動的にクエリし、カスタム データ テーブルを分析用に生成します。 適切な詳細レベルを維持し、データを失うことなく適切な集計を維持しながら、NULL を処理します。 |
結合 | 結合句と結合タイプに基づいて 2 つのデータ テーブルをマージし、固定されたデータ テーブルを新規作成します。基本的な行構造が同じデータの新しい列を追加するために使用されることが多くあります。 フィールドがすべてのテーブルに存在しない場合、一部の結合タイプでデータが失われる可能性があります。テーブルの詳細レベルが異なる場合、データが重複する可能性があります。 |
ユニオン | 複数のデータ テーブルをマージして、固定されたデータ テーブルを新規作成します。基本的な列構造が同じデータの新しい行を追加するために使用されます。 |
ブレンド | 複数の個別の Tableau データ ソースで作業します。データは個別の状態のままです。Tableau は、データ ソースを個別にクエリし、そのシートに対して設定されたリンク フィールドに基づいて、ビュー内で結果をまとめ、視覚化します。左結合の動作を模倣して、セカンダリ データ ソースからのデータをフィルターできる場合があります。 |
注: データをカスタム SQL と組み合わせることも可能です。多くの場合、キャンバス内で直接データを組み合わせるか、データ ブレンドで組み合わせることをお勧めします。これにより、Tableau で最適化に対する柔軟性が最大限に高まります。ただし、一部のシナリオでは、カスタム SQL を使用する理由があります。Tableau では、カスタム SQL ステートメントを書き込まれたとおりに実行する必要があるため、パフォーマンスに影響がでる可能性があります。
関係
関連付けは、複数のテーブル間の共有フィールド (列) に基づいて複数テーブルのデータを使用する方法です。リレーションシップを確立すると、行を複数のテーブルで接続する方法が Tableau に通知されます。Tableau はその情報を保持しますが、行をすぐにまとめるわけではありません。代わりに、ビジュアライゼーションが作成されると、分析に関連するフィールドがリレーションシップを通じて追跡され、適切なデータが元のテーブルから返されます。
データがビジュアライゼーションのコンテキスト外で単一のテーブルに完全に取り込まれることはないため、データの詳細レベルや粒度が異なる場合は、リレーションシップが便利です。たとえば、1 つのテーブルで毎日の降雨量に関するデータを使用する必要があるが、別のテーブルでは 1 時間ごとの温度を使用する必要がある場合などです。
Tableau は、同じデータベース内のテーブル間、および異なるデータベース内のテーブル間のリレーションシップをサポートします。
リレーションシップを使用してテーブルを組み合わせる方法の詳細については、データの関連付けおよび Tableau ブログ投稿を参照してください。
- 関係 (パート 1): Tableau に新しいデータ モデリングを導入する(新しいウィンドウでリンクが開く)
- 関係 (パート 2): ヒントとテクニック(新しいウィンドウでリンクが開く)
- 関係 (パート 3): 複数の関連するテーブルを横断して質問する(新しいウィンドウでリンクが開く)
注: Tableau バージョン 2024.2 以降では、Tableau データ モデルは、マルチファクト関係を通じてマルチファクト分析と共有ディメンションをサポートします。詳細については、「マルチファクト関係データ モデルについて」(新しいウィンドウでリンクが開く)、「マルチファクト関係モデルを使用するとき」(新しいウィンドウでリンクが開く)、「マルチファクト関係データ モデルの構築」(新しいウィンドウでリンクが開く)を参照してください。
結合
結合は、共通のフィールドによって関連する表を組み合わせる方法です。結合を使用してデータを組み合わせるとテーブルが作成され、データの列が追加されることによって横方向に拡張されます。
Tableau でのデータの結合方法の詳細については、データの結合を参照してください。
データ ブレンド
データ ブレンドを使用してデータを組み合わせる場合は、プライマリ データ ソースと呼ばれるデータを、1 つ以上のセカンダリ データ ソースの共通のフィールドと組み合わせます。
データ ブレンドは、データ ソースの構成方法をシート単位で変更する必要がある場合や、
キューブ データ ソースやパブリッシュされたデータ ソースなどリレーションシップや結合が許可されていないデータベースを結合する場合に便利です。
データ ブレンドを使用してデータを組み合わせると仮想のテーブルが作成され、データの列が追加されることによって横方向に拡張されます。各データ ソースのデータは、ビジュアライゼーションでまとめて表示される前に、共通のレベルに集計されます。
Tableau でのデータ ブレンドの仕組みやデータをブレンドする方法の詳細については、データのブレンドを参照してください。
ユニオン
ユニオンは、値 (行) をテーブルに追加する方法です。同じ列がある場合、表のユニオンを作成できます。ユニオンを使用してデータを組み合わせると、同じ列を持つ仮想の表ができあがりますが、データの行が追加されることによって縦方向に拡張されます。
表のユニオンを行うには、手動とワイルドカード検索の 2 つの方法があります。Tableau でこれらのメソッドのいずれかを使用したデータのユニオン方法の詳細については、データのユニオンを参照してください。