パート 2 - Tableau Server 導入の参照アーキテクチャ

注: Tableau は、企業環境への導入ガイドの更新を終了しました。AWS での Tableau Server の有効な導入モデルとして、ここで説明されているリファレンスアーキテクチャは引き続き推奨されていますが、具体的な構成手順が前回の更新時から変更されている可能性があります。必ず最新の Tableau Server ヘルプ(新しいウィンドウでリンクが開く) ドキュメントと照らし合わせて、正確な手順を確認してください。

次の画像は、関連する Tableau Server プロセスと、それらがリファレンスアーキテクチャーにどのように展開されているかを示しています。これは、企業環境での導入において求められる Tableau Server の最小構成です。

このトピックのプロセス図は、各ノードの特徴的で主要なプロセスを示すことを目的としています。ノードで実行されるサポートプロセスには、図に示されていないものも多くあります。すべてのプロセスの一覧については、このガイドの構成セクションパート 4 - Tableau Server のインストールと構成を参照してください。

Tableau Server プロセス

Tableau Server 参照アーキテクチャでは、PostgreSQL 上に外部リポジトリを備えた、4 つのノードからなる Tableau Server のクラスタを導入します。

Tableau Server 初期ノード (ノード 1): TSM 管理サービスとライセンスサービスを実行します。これらは必須のサービスであり、クラスター内の単一ノードでのみ実行できます。エンタープライズ環境では、Tableau Server 初期ノードはクラスター内のプライマリノードです。このノードは、ノード 2 を使用して冗長アプリケーションサービスも実行します。
Tableau Server アプリケーションノード (ノード 1 およびノード 2): これらの 2 つのノードは、クライアント要求の処理、データソースへの接続とクエリ実行、データノードへの接続を行います。
Tableau Server データノード (ノード 3 およびノード 4): これらの 2 つのノードはデータ管理専用です。
外部 PostgreSQL: このホストは Tableau Server リポジトリプロセスを実行します。HA 構成では、アクティブ/パッシブ冗長性のために PostgreSQL ホストを追加で実行する必要があります。
PostgreSQL は Amazon RDS でを実行することもできます。RDS と EC2 インスタンスでのリポジトリの実行の違いについては、「Tableau Server 外部リポジトリ」 (Linux(新しいウィンドウでリンクが開く)) を参照してください。
外部リポジトリを使用して Tableau Server を展開するには、Tableau Advanced Management ライセンスが必要です。
社内組織に DBA の専門知識がない場合は、オプションで、デフォルトの内部 PostgreSQL 構成を使用して Tableau Server リポジトリプロセスを実行することもできます。デフォルトのシナリオでは、PostgreSQL が埋め込まれている Tableau ノードでリポジトリを実行します。その場合、リポジトリのフェイルオーバーに対応するために、専用の Tableau ノードでリポジトリを実行し、別の専用ノードでパッシブリポジトリを実行することをお勧めします。リポジトリフェイルオーバー (Linux(新しいウィンドウでリンクが開く)) を参照してください。
たとえば、このガイドに記載されている AWS の実装では、EC2 インスタンスで実行されている PostgreSQL に外部リポジトリを展開する方法を説明しています。
オプション: 外部ストレージを使用している場合は、Tableau ファイルストアを外部サービスとして導入できます。このガイドの主要な導入シナリオでは、外部ファイルストアを扱っていません。「外部ファイルストアを使用して Tableau Server をインストールする (Linux(新しいウィンドウでリンクが開く))」を参照してください。

外部ファイルストアを使用して Tableau Server を展開するには、Tableau Advanced Management ライセンスが必要です。

PostgresSQL リポジトリ

Tableau Server リポジトリは PostgresSQL データベースであり、サーバーデータを格納します。このデータには、Tableau Server のユーザー、グループとグループ割り当て、パーミッション、プロジェクト、データソース、抽出のメタデータと更新などに関する情報が含まれています。

それぞれ象徴的な象のロゴが付いた 2 つの PostgreSQL データベース間でデータレプリケーションが行われています。

デフォルトの PostgresSQL の導入では、システムメモリリソースのほぼ 50% を消費します。実稼働の導入の場合や、それが大規模である場合などの使用量に応じて、リソースの消費量が増える可能性があります。このため、リポジトリプロセスを実行するコンピューターは、リソースを大量に消費する、VizQL、バックグラウンダー、データエンジンなどのサーバーコンポーネントを実行していないコンピューターにすることをお勧めします。これらのコンポーネントのいずれかと一緒にリポジトリプロセスを実行すると、IO の競合、リソースの制約などが発生し、導入の全体的なパフォーマンスが低下します。

ノード 1: 初期ノード

初期ノードは重要な少数のプロセスを実行し、アプリケーションの負荷をノード 2 と共有します。

Tableau を最初にインストールするコンピューターである「初期ノード」には、固有の特徴があります。初期ノード上で実行できるのは、ライセンスサービス (ライセンスマネージャー)、ライセンス認証サービス、TSM コントローラー (管理コントローラー) の 3 つのプロセスのみで、エラーが発生した場合を除き、これらのプロセスを他のノードに移動させることはできません。

ノード 1 のフェイルオーバーと自動復元

ライセンス、アクティブ化、および TSM コントローラーサービスは、Tableau Server を健全に展開するための重要なサービスです。参照アーキテクチャーが適切に構成されていれば、ノード 1 で障害が発生してもノード 2 に要求がルーティングされるため、ユーザーは引き続き Tableau Server 構成に接続できます。いっぽう、これらのコアサービスがなければ、Tableau Server 構成は障害が発生したままの重大な状態になります。「初期ノードの自動リカバリ」を参照してください。

ノード 1 およびノード 2: アプリケーションサーバー

ノード 1 とノード 2 は Tableau Server プロセスを実行し、クライアント要求の処理、データソースへのクエリ、ビジュアライゼーションの生成、コンテンツと管理の処理、その他の Tableau ビジネスロジックを実施します。アプリケーションサーバーではユーザーデータは保存されません。

注:「アプリケーションサーバー」は、TSM にリストされている Tableau Server プロセスを指すこともあります。"アプリケーションサーバー" の基盤となるプロセスは VizPortal です。

ノード 1 とノード 2 は、並行して実行すると拡張され、リバースプロキシサーバーによる負荷分散ロジックからの要求を処理できます。冗長ノードとして、どれか 1 つのノードに障害が発生しても、クライアントの要求とサービスは残りのノードによって処理されます。

参照アーキテクチャは、補完的なアプリケーションプロセスが同一のコンピューターで実行されるように設計されています。つまり、このプロセスによって、コンピューティングリソースの競合が発生したり、誘発されたりすることはありません。

たとえば、アプリケーションサーバー上のコア処理サービスである VizQL は CPU とメモリに大きく依存しており、VizQL はコンピューターの CPU とメモリの約 60 ～ 70% を使用します。このため、リファレンスアーキテクチャは、他のメモリや CPU にバインドされたプロセスが VizQL と同じノード上に存在しないように設計されています。負荷の量やユーザー数が VizQL ノードのメモリや CPU の使用量に影響を与えないことはテストで確認済みです。たとえば、負荷テストで同時ユーザー数を減らしても、ダッシュボードやビジュアライゼーションの読み込みプロセスのパフォーマンスのみに効果があるものの、リソースの使用率は軽減されません。したがって、ピーク使用時に使用可能なメモリと CPU に基づいて、VizQL プロセスを追加することを検討できます。一般的なワークブックの開始方法として、まず VizQL プロセスごとに 4 つのコアを割り当てます。

アプリケーションサーバーの拡張

参照アーキテクチャは、使用量ベースのモデルに基づいて、拡張性を考慮して設計されています。最大 1000 人のユーザーをサポートするアプリケーションサーバーを少なくとも 2 台導入することを、一般的な出発点として推奨します。ユーザーの規模が拡大するのに合わせて、1000 ユーザーごとにアプリケーションサーバーを追加することを計画します。使用状況とパフォーマンスを監視して、自分の組織に適した、ホストあたりのユーザー規模を調整します。

ノード 3 およびノード 4: データサーバー

ファイルストア、データエンジン (ハイパー)、バックグラウンダーなどのプロセスは、次の理由からノード 3 やノード 4 に配置します。

同一ノード上でバックグラウンダー、Hyper、およびファイルストアを実行することで、パフォーマンスと信頼性が最適化されます。抽出プロセス中に、バックグラウンダーがターゲットのデータベースに対してクエリを実行し、Hyper ファイルを同じノードに作成してから、ファイルストアにアップロードします。これらのプロセスを同じ場所に配置することにより、抽出作成ワークフローでは、ネットワークまたはノード間で大量のデータをコピーする必要がありません
リソースのバランシング: バックグラウンダーは主に CPU を集中的に使用します。データエンジンはメモリを大量に消費するプロセスです。これらのプロセスを結合することによって、各ノードのリソース使用率を最大化できます。
データプロセスの統合: これらの各プロセスはバックエンドのデータプロセスであるため、安全なデータ層の中で実行することは理にかなっています。参照アーキテクチャの今後のバージョンでは、アプリケーションサーバーとデータサーバーは別々の層で実行されます。ただし、Tableau アーキテクチャにはアプリケーションの依存関係があるため、この時点では、アプリケーションサーバーとデータサーバーを同じ層で実行する必要があります。

データサーバーの拡張

アプリケーションサーバーと同様に、Tableau データサーバーに必要なリソースを計画するには、使用量ベースのモデルが必要です。一般に、各データサーバーが 1 日あたり最大 2000 の抽出更新ジョブをサポートできると想定します。抽出ジョブの増加に伴い、ファイルストアサービスを使用せずにデータサーバーを追加します。一般的に、2 ノードのデータサーバー展開は、ファイルストアサービスにローカルファイルシステムを使用する展開に適しています。アプリケーションサーバーを追加しても、データサーバーのパフォーマンスや拡張性に直線的に影響を与えることはありません。実際のところ、ユーザークエリの追加によるオーバーヘッドを除くと、アプリケーションホストとユーザーの追加による影響は最小限です。

一番上に戻る

フィードバックをお送りいただき、ありがとうございます。

フィードバックは正常に送信されました。ありがとうございます!

企業環境への Tableau Server 導入ガイド