Data Connect について

Data Connect を使用すると、Tableau Cloud ユーザーはプライベート ネットワークまたはクラウド サービス上のデータ ソースにアクセスできます。Data Connect は共有責任モデルとして機能します。このモデルでは、お客様が物理的または仮想的コンピューティング リソースを提供し、Tableau がそれらのリソース上で Data Connect Kubernetes クラスターをホストおよび管理します。

お使いの環境では、Data Connect Kubernetes クラスターが一連のコンテナを監視します。コンテナは、1 つまたは複数のエージェントで構成されるランタイム環境をサポートします。エージェントは、タスクを実行したり、組織間でファイアウォールを介して安全に通信できるようにしたりするプログラムです。

Data Connect サービスには以下が含まれます。

  • クラスターの監視とトラブルシューティング: Tableau は、Data Connect エージェントの状態と使用状況を監視します。リソースが最も効果的かつ効率的に使用されるようにするために、テレメトリ データを収集します。

  • クラスターのメンテナンス: アップグレードは自動的に展開され、クラスターの操作とメンテナンスについては、Tableau が所有者として完全に実行します。Data Connect は、ニーズと利用可能なコンピューティング プールに基づいて、ワークロードの展開を自動的に最適化します。

  • アラート監視: 問題を迅速に解決してビジネスへの影響を抑えるために、インシデント管理が継続的に提供されます。

コネクタのサポート

Data Connect は、Tableau Bridge for Linux でサポートされているのと同じコネクタをサポートします。接続オプションの詳細については、「Bridge を使用した接続」を参照してください。

環境のサポート

現在、Data Connect はオンプレミス環境と VCP 環境 (Amazon Web Services (AWS)、Microsoft Azure、Google Cloud Platform (GCP)) をサポートしています。Data Connect ノードは、単一の Tableau Cloud サイトと互換性があります。ノードはデータと同じネットワークにインストールする必要があります。そのため、サービスの可用性を維持するために、お客様はサイトごとにプライベート ネットワークごとに少なくとも 3 つのノードを計画する必要があります。Data Connect ノードは Data Connect 専用にする必要があります。Tableau が所有するクラスターに他のコンテナを展開することはできません。また、既存のクラスターを Data Connect に使用することはできません。

アーキテクチャ

Data Connect アーキテクチャは、3 つの主要コンポーネントと責任境界で構成されます。一部は重複しますが、Tableau は主にアプリケーション層とオーケストレーション層に責任を持ち、お客様はインフラ (コンピューティング、OS、ネットワーク、ストレージ) とその配置場所に責任を持ちます。

  1. Tableau Cloud → オーケストレーション サービス

  2. Kubernetes クラスター → オーケストレーション サービス

  3. Kubernetes クラスター → コンテナ

  4. Tableau ユーザー → Tableau Cloud

  5. Data Connect エージェント (コンテナ) → Tableau Cloud

  6. Data Connect エージェント (コンテナ) → お客様データベース

セキュリティ

Data Connect のセキュリティ」を参照してください。

データ接続のコンポーネント

Data Connect ソリューションの主なコンポーネントはクラスターです。クラスターは、1 つ以上のノードで構成される Kubernetes クラスターです。各 Kubernetes ノードは少なくとも 1 つのコンテナをホストし、そのコンテナは Data Connect エージェントをホストします。エージェントはライブ クエリと抽出クエリを実行します。

プールは、特定のクエリを完了するクラスターを指定するネットワーク ルールの論理グループです。展開計画のコンテキストでは、プールは負荷分散を目的としてエンドポイント (ドメインまたは IP アドレス) のコレクションをホストします。ドメインには、プライベート クラウド データ、リレーショナル データ、ファイル データなどが含まれます。

クラスターがデータ ソースにアクセスして更新できるようにするために、各プールがクラスターに割り当てられます。負荷を分散するために、クラスターに複数のプールを追加できます。

展開の概要

開始するには、各 Linux サーバーでスクリプトを実行します。このスクリプトは、環境内に Tableau によって管理される Kubernetes クラスターを構成します。Kubernetes クラスターは Tableau によって管理されます。

Kubernetes が構成されたら、Docker コンテナをクラスターに展開します。その後、Tableau はコンテナ内に Data Connect エージェントを展開し、リモートで管理します。Tableau でこの構成が確立されたら、プライベート ネットワーク データ ソースに接続をマッピングします。

Data Connect の導入については、ホワイトペーパー「Tableau Cloud でプライベート ネットワーク データにアクセスする - Data Connect と Tableau Bridge のベスト プラクティス(新しいウィンドウでリンクが開く)」(英語) をダウンロードしてください。

データベース接続

クエリはクラスター内の Data Connect エージェントから管理されます。データは、Data Connect エージェントから Tableau Cloud に直接送信されます。Data Connect では、外部ネットワーク アクセス、ファイアウォール ホール、またはリモート マシン アクセスは必要ありません。

  1. エージェントが、安全な WebSocket (wss://) を使用して Tableau Cloud Data Connect サービスへの永続的な接続を確立します。クライアントが Tableau Cloud からの要求を待ちます。

    • ライブ接続または仮想接続を使用したデータ ソースの場合、Tableau Cloud が Data Connect エージェントへのクエリを開始します。
    • 更新スケジュールを使用する抽出接続を持つデータ ソースの場合、クライアントが更新スケジュールの要求を受信し、 データ ソース (.tds) ファイルへの安全な接続 (https://) を使用して、Tableau Cloud に接触します。
  2. エージェントは、ジョブ要求に含まれている認証資格情報を使用してプライベート ネットワーク データに接続します。

  3. データベースがクエリの結果を返します。

  4. Data Connect エージェントはペイロードを受信し、それを Data Connect サービスに返します。