Data Connect について
Data Connect を使用すると、Tableau Cloud ユーザーはプライベート ネットワークまたはクラウド サービス上のデータ ソースにアクセスできます。Data Connect は共有責任モデルとして機能します。このモデルでは、お客様が物理的または仮想的コンピューティング リソースを提供し、Tableau がそれらのリソース上で Data Connect Kubernetes クラスターをホストおよび管理します。
お使いの環境では、Data Connect Kubernetes クラスターが一連のコンテナを監視します。コンテナは、1 つまたは複数のエージェントで構成されるランタイム環境をサポートします。エージェントは、タスクを実行したり、組織間でファイアウォールを介して安全に通信できるようにしたりするプログラムです。
Data Connect サービスには以下が含まれます。
クラスターの監視とトラブルシューティング: Tableau は、Data Connect エージェントの状態と使用状況を監視します。リソースが最も効果的かつ効率的に使用されるようにするために、テレメトリ データを収集します。
クラスターのメンテナンス: アップグレードは自動的に展開され、クラスターの操作とメンテナンスについては、Tableau が所有者として完全に実行します。Data Connect は、ニーズと利用可能なコンピューティング プールに基づいて、ワークロードの展開を自動的に最適化します。
アラート監視: 問題を迅速に解決してビジネスへの影響を抑えるために、インシデント管理が継続的に提供されます。
コネクタのサポート
Data Connect は、Tableau Bridge for Linux でサポートされているのと同じコネクタをサポートします。接続オプションの詳細については、「Bridge を使用した接続」を参照してください。
環境のサポート
現在、Data Connect はオンプレミス環境と VCP 環境 (Amazon Web Services (AWS)、Microsoft Azure、Google Cloud Platform (GCP)) をサポートしています。Data Connect ノードは、単一の Tableau Cloud サイトと互換性があります。ノードはデータと同じネットワークにインストールする必要があります。そのため、サービスの可用性を維持するために、お客様はサイトごとにプライベート ネットワークごとに少なくとも 3 つのノードを計画する必要があります。Data Connect ノードは Data Connect 専用にする必要があります。Tableau が所有するクラスターに他のコンテナを展開することはできません。また、既存のクラスターを Data Connect に使用することはできません。
アーキテクチャ
Data Connect アーキテクチャは、3 つの主要コンポーネントと責任境界で構成されます。一部は重複しますが、Tableau は主にアプリケーション層とオーケストレーション層に責任を持ち、お客様はインフラ (コンピューティング、OS、ネットワーク、ストレージ) とその配置場所に責任を持ちます。
Tableau Cloud → オーケストレーション サービス
Kubernetes クラスター → オーケストレーション サービス
Kubernetes クラスター → コンテナ
Tableau ユーザー → Tableau Cloud
Data Connect エージェント (コンテナ) → Tableau Cloud
Data Connect エージェント (コンテナ) → お客様データベース
セキュリティ
「Data Connect のセキュリティ」を参照してください。
データ接続のコンポーネント
Data Connect ソリューションの主なコンポーネントはクラスターです。クラスターは、1 つ以上のノードで構成される Kubernetes クラスターです。各 Kubernetes ノードは少なくとも 1 つのコンテナをホストし、そのコンテナは Data Connect エージェントをホストします。エージェントはライブ クエリと抽出クエリを実行します。
プールは、特定のクエリを完了するクラスターを指定するネットワーク ルールの論理グループです。展開計画のコンテキストでは、プールは負荷分散を目的としてエンドポイント (ドメインまたは IP アドレス) のコレクションをホストします。ドメインには、プライベート クラウド データ、リレーショナル データ、ファイル データなどが含まれます。
クラスターがデータ ソースにアクセスして更新できるようにするために、各プールがクラスターに割り当てられます。負荷を分散するために、クラスターに複数のプールを追加できます。
展開の概要
開始するには、各 Linux サーバーでスクリプトを実行します。このスクリプトは、環境内に Tableau によって管理される Kubernetes クラスターを構成します。Kubernetes クラスターは Tableau によって管理されます。
Kubernetes が構成されたら、Docker コンテナをクラスターに展開します。その後、Tableau はコンテナ内に Data Connect エージェントを展開し、リモートで管理します。Tableau でこの構成が確立されたら、プライベート ネットワーク データ ソースに接続をマッピングします。
データベース接続
クエリはクラスター内の Data Connect エージェントから管理されます。データは、Data Connect エージェントから Tableau Cloud に直接送信されます。Data Connect では、外部ネットワーク アクセス、ファイアウォール ホール、またはリモート マシン アクセスは必要ありません。
エージェントが、安全な WebSocket (wss://) を使用して Tableau Cloud Data Connect サービスへの永続的な接続を確立します。クライアントが Tableau Cloud からの要求を待ちます。
- ライブ接続または仮想接続を使用したデータ ソースの場合、Tableau Cloud が Data Connect エージェントへのクエリを開始します。
- 更新スケジュールを使用する抽出接続を持つデータ ソースの場合、クライアントが更新スケジュールの要求を受信し、 データ ソース (.tds) ファイルへの安全な接続 (https://) を使用して、Tableau Cloud に接触します。
エージェントは、ジョブ要求に含まれている認証資格情報を使用してプライベート ネットワーク データに接続します。
データベースがクエリの結果を返します。
Data Connect エージェントはペイロードを受信し、それを Data Connect サービスに返します。