抽出クエリの負荷が大きい環境用に最適化

このトピックでは、抽出クエリの負荷が大きい環境でパフォーマンスを最適化および改善するために、Tableau Server のトポロジと構成を具体的に設定するためのガイドを提供します。

抽出クエリの負荷が大きい環境とはワークブック、ビュー、ダッシュボードの読み込み中には、抽出とフェデレーションデータソースに対してクエリが実行されるため、多くのクエリワークロードが作成されます。そのため、抽出とフェデレーションデータソースが多くある場合は、「抽出クエリの負荷が大きい環境」であると言えます。

上記で定義したように、抽出クエリの負荷が大きい環境である場合、次の 2 つのセクションを参考にして、この構成が適切かどうかを判断することができます。

この構成を使用するタイミング

この構成の背後にある重要な理由: Hyperは、高速データ取り込みと分析処理に適した Tableau のメモリ最適化データエンジンテクノロジーであり、クエリの負荷が大きいワークロードを最適化することの重要性を裏付けています。抽出の使用の拡大に伴い、Tableau Server クラスタの専用ノードでデータエンジンを構成することをお勧めします。この構成により、Tableau Server はインフラストラクチャをスケールアウトして、抽出をクエリするときのパフォーマンスを最適化できます。

抽出とフェデレーションデータソースを使用してコンテンツを表示する場合、Tableau Server のパフォーマンスに影響を与えるいくつかの要因があります。ここでの目標は、サーバーでコンテンツを表示するときに、一貫性のある信頼性の高いクエリパフォーマンスを実現することです。この構成は、以下のいずれかの条件がお使いの環境に該当する場合に使用します。

ワークブックの読み込み時間には大きなばらつきがあり、ワークブックでは抽出またはフェデレーションデータソースが使用されている。
Tableau Server の展開で、Creator、Explorer、Viewer の数、および抽出ベースのコンテンツの数が増加しているため、効率的にスケールアウトする必要がある。
ファイルストアがマシンに存在するときに、データエンジンと VizQL Server 間でリソースの競合がある。
大量のデータを分析する。この構成は、データの取り込みと分析の両方で、ビッグデータシナリオのパフォーマンスを最適化するのに役立ちます。Tableau とビッグデータの詳細については、「Tableau を使用したハイパーチャージビッグデータ分析」を参照してください。

注: クエリの実行時間を確認するには、サーバー側のパフォーマンスの記録を使用します。Tableau のリソース利用状況を確認するには、Windows インストールではパフォーマンスモニター、Linux インストールでは sysstat または vmstat ツールを使用します。

この構成を使用する利点

データエンジンの専用ノードを構成する主な利点は次のとおりです。

専用のデータエンジンノードにより、抽出クエリと、リソースを大量に消費する他のワークロード (VizQL Server によって処理されるワークロードなど) との間のリソースの競合が減少します。
抽出クエリは、専用ノードで動的に負荷分散されます。その際、過剰に活用されているノードや、十分に活用されていないノードがないように、システムの現在の状態がチェックされます。
抽出に依存するワークブックを読み込む際に、ユーザーエクスペリエンスのさらに一貫したパフォーマンスが得られます。ここで焦点を当てるのは、個々のクエリを改善することではなく、一貫性のある信頼できるパフォーマンスを確立することです。
より多くのリソースを必要とする Tableau Server プロセスのスケールアウトをより詳細に制御できます。VizQL Server、データエンジン、およびバックグラウンダーがすべて同じノードで実行されており、抽出クエリが遅いことが問題である場合、3 つのすべてのプロセスで 2 つ目のノードを追加しても、パフォーマンスを向上させることは困難です。この構成を使用すると、抽出クエリのワークロードを具体的に改善するノードを追加できます。
可用性とアップタイムを改善するのに役立ちます。障害が発生し、専用のデータエンジンノードの 1 つが使用できない場合、VizQL Server は、問題のあるノードで保留中の要求を他の専用のデータエンジンノードにルーティングしようとします。
データエンジンはマシンで利用可能な数のコアを活用します。これにより、専用のデータエンジンノードにリソースをさらに追加して、クエリ応答時間や高価な抽出クエリのばらつきを低減したり、専用のデータエンジンノードを追加して、サーバーでの抽出クエリのスループットを向上させたりするなど、柔軟に対応できます。
データエンジンは、CPU 利用率を 1 時間あたり平均 75% に抑えるようにデフォルトで設定されています。これは、他の Tableau Server プロセスとの競合を回避することを目的としています。データエンジンを専用ノードで実行している場合は、この平均を 95% まで増やすことができます。これを行うための詳細については、「hyper.srm_cpu_limit_percentage」を参照してください。

この構成を使用しないタイミング

抽出ベースのクエリの読み込みで問題が発生していない場合は、ハードウェアリソースを Tableau Server の他の部分に割り当てる方が適切な場合があります。
ファイルストア、データエンジン、および VizQL Server が共存するノードでは、データエンジンと VizQL Server との間でリソースの競合は発生しません。
この構成を実装する前に、VizQL Server の CPU 使用率、およびファイルストアと共にインストールされたデータエンジンが存在するノードの CPU 使用率を評価することが強く推奨されています。

設定

この構成の主な目標は、1 つ以上の専用ノードにデータエンジンを配置することです。

つまり、ファイルストアがローカルにインストールされている展開では、1 つ以上の専用ノードでファイルストアを構成するということです。データエンジンは、ファイルストアと同じノードに自動的にインストールされます。
外部ファイルストアを構成している展開では、引き続き Tableau Server の専用ノードでデータエンジンを構成できます。

つまり、VizQL Server とファイルストアのプロセスを分けることで、抽出クエリの負荷と、ビューの読み込みまたは操作にかかる負荷との間の均衡が取れ、管理を向上させることができます。この構成は、抽出をクエリする際に一貫したパフォーマンスを得ることを目標としています。

以下は、データエンジン/ファイルストアプロセスにノード 5 と 6 の 2 つの専用ノードがある構成を視覚的に表したものです。これは、ファイルストアがローカルに構成されている例であり、データエンジンとファイルストアのプロセスが同じ場所に配置されています。

外部ファイルストアを使用した展開で同じ構成を使用しても機能しますが、その場合、ノード 5 と 6 にはデータエンジンのみが構成されます。

さらに、ノード 1 にはリポジトリプロセスとファイルストアプロセスがあり、バックアップの実行に必要なすべてのデータがノード 1 に存在するため、バックアップのパフォーマンスを向上させることができます。

各ノードで実行されているプロセスを表示する表。

ハードウェアのガイダンス

この構成を最大限に活用するには、さまざまなハードウェアサイズと構成を試して、ピーク負荷のパフォーマンス目標に最適なものを確認する必要があります。Hyper は高性能データベーステクノロジーであり、パフォーマンスに影響を与える主要なリソースは、メモリ、コア、およびストレージ I/O です。Hyper がリソースを使用してクエリを処理する方法を理解すると、さまざまな構成の中からハードウェアを選択でき、その理由を理解できるようになります。

メモリ: 抽出ベースのクエリがユーザーまたはバックグラウンドプロセスに対して処理されると、Tableau Server は専用のデータエンジンノードを選択し、クエリを処理します。その専用のデータエンジンノードは、抽出をローカルストレージ (多くの場合、サーバーのハードディスク) からメモリにコピーします。使用可能なシステムメモリが増えると、オペレーティングシステムは Tableau のメモリ使用率をより適切に管理できるようになります。専用のデータエンジンノードは、システムメモリを使用して、実行されたクエリの結果セットを保存します。結果セットがまだ有効で、オペレーティングシステムがそれをメモリからクリアしていない場合は、メモリ内の結果セットを再利用できます。

Tableau Server の推奨される最小ハードウェア要件は 32 GB のメモリですが、抽出ベースのワークブックが大量に読み込まれることが予想される場合は、64 GB または 128 GB を検討する必要があります。コアなどのメモリに加えて、他のリソースの制限値に達した場合は、128 Gbのメモリにスケールアップする代わりに、64 GB の専用データエンジンノードにスケールアウトする方がよい場合があります。

抽出をローカルストレージからメモリにコピーするプロセスには時間がかかるため、ディスクパフォーマンスの最適化が必要になる場合があります。ディスクパフォーマンスの最適化については、[ストレージ I/O] セクションで説明しています。
コア: 抽出ベースのクエリを処理する場合、コアの数はパフォーマンスとスケーラビリティに影響を与える可能性のある重要なハードウェアリソースです。CPU コアはクエリの実行を担い、使用可能なコアが多いほど実行時間が短縮されます。一般的に、コアの数を 2 倍にすると、クエリの実行時間は半分になります。たとえば、現在 4 物理コアまたは 8 vCPU を使用しているクエリの実行時間は 10 秒ですが、8 物理コアまたは 16 vCPU にアップグレードすると、実行時間が 5 秒になります。

現在の Tableau Server で推奨される最小ハードウェア要件は 8 コアですが、展開で抽出を使用する場合は、16 または 32 コアのマシンを検討してください。ここで注意すべき重要な点は、メモリと I/O がボトルネックである場合、使用可能なコアを増やしてもクエリのパフォーマンスは向上しません。
ストレージ I/O: Hyper は、抽出ストレージデバイスの利用可能なパフォーマンスを活用して、クエリ処理を高速化するように設計されています。読み取り/書き込み速度が速いソリッドステートドライブ (SSD) などの高速ディスクストレージを選択することをお勧めします。現在利用可能な最速のディスクストレージは、NVMe ストレージプロトコルを使用する SSD です。

注: 専用のデータエンジンノードのリソースのサイズ設定は、抽出クエリのパフォーマンスにのみ影響します。ワークブックを読み込む際には、VizQL の読み込み要求の合計時間を構成する他の多くのプロセスが伴います。たとえば、VizQL Server プロセスは、データエンジンからデータを取得し、視覚化をレンダリングする役割を担います。

その他のパフォーマンスの調整と最適化:

上記の基本構成の他に、パフォーマンスを最適化するために使用できる追加機能があります。以下で説明する最適化は、ローカルファイルストアと外部ファイルストアの両方の展開に適用できます。

抽出クエリのロードバランシング: データエンジンは、抽出クエリをルーティングする場所を決定するために、サーバーヘルスメトリクスを使用します。これは、データエンジンが消費しているリソースの量と、同じノードで実行されている可能性のある他の Tableau プロセスからの負荷です。システムリソースの評価に加えて、抽出がノードのメモリに既に存在するかどうかも考慮され、クエリを処理するための可用性が最も高いリソースを持つノードに抽出クエリが送信されるようにします。これにより、メモリとディスクの使用効率が向上し、抽出がノード全体のメモリに複製されなくなります。詳細については、抽出クエリのロードバランシングのヘルプ記事を参照してください。

抽出クエリのロードバランシング機能は、Tableau Server バージョン 2020.2 以降では既定で有効になっています。
ノードロールを使用したワークロードの最適化: バックグラウンダーおよびファイルストアノードロールを使用すると、サーバー管理者は、抽出クエリと抽出更新を実行する専用のノードをより柔軟に制御できます。上記のトポロジ図で説明したように、特定のデータエンジンノードは抽出クエリを処理する専用のノードであるため、ファイルストアプロセスとデータエンジンプロセスのみを実行します。ノードロールは Advanced Management で使用できます。詳細については、ノードロールによるワークロード管理を参照してください。

次の図は、上記の基本構成と同じトポロジを使用していますが、ノードロールが設定されています。

プロセスとノードを含む外部ロードバランサーの表。

抽出更新バックグラウンダーのノードロール: ノード 3 を抽出更新バックグラウンダーのノードロールに設定すると、増分更新、完全更新、暗号化/復号化ジョブのみがこのノードで実行されます。ノード 4 を抽出更新なしのバックグラウンダーのノードロールに設定すると、抽出更新以外のすべてのバックグラウンドジョブがこのノードで実行されます。データサーバーとゲートウェイは、フェデレーション抽出とシャドウ抽出を使用するときに、抽出更新ジョブを支援します。バックグラウンダーのノードロールの詳細については、ファイルストアノードロールを参照してください。

さらに、ノード 1 にはリポジトリプロセスとファイルストアプロセスがあり、バックアップの実行に必要なすべてのデータがノード 1 に存在するため、バックアップのパフォーマンスを向上させることができます。

バックグラウンダーのノードロールは、Tableau Server バージョン 2019.3 以降の Advanced Management で使用できます。
抽出クエリのファイルストアのノードロール: 専用データエンジンノードであるノード 5 とノード 6 には、抽出クエリのファイルストアのノードロールがあり、viz のロード、サブスクリプション、データ駆動型アラートのクエリのみを処理します。
抽出クエリのインタラクティブなファイルストアのノードロール: 抽出クエリのファイルストアのノードロールが割り当てられた専用データエンジンノードの場合、サーバー管理者は、インタラクティブなワークロードとスケジュールされたワークロードを分離して、特定の専用データエンジンノードで実行することができます。これは、大量のサブスクリプションが発生しているときに、多くのユーザーがワークブックを操作したり、読み込んだりしている場合に役立ちます。たとえば、月曜日の午前 8 時に 1000 のサブスクリプションがスケジュールされているとします。同時に、1 日の始めに多くのユーザーがダッシュボードを読み込んでいます。サブスクリプションにユーザークエリの量が加わるため、ワークブックの読み込みが遅くなり、読み込み時間が変動しやすくなる可能性があります。抽出クエリのインタラクティブなファイルストアのノードロールを使用すると、専用データエンジンノードを指定して、インタラクティブユーザー (画面を見て待機しているユーザー) のクエリのみを受け入れることができます。インタラクティブなワークロードに対して優先されるこれらの専用データエンジンノードは、競合する大量のサブスクリプションジョブから保護され、クエリ時間の一貫性が向上します。さらに、サーバー管理者はこのノードロールを使用して、インタラクティブなワークロードとスケジュールされたワークロードにそれぞれ専用のデータエンジンノードを追加できるため、増加に備えた優れたプランニングを行うことができます。詳細については、ファイルストアノードロールを参照してください。

ファイルストアのノードロールは、Tableau Server バージョン 2020.4 以降の Advanced Management で使用できます。
外部ファイルストアを使用した最適化: この機能を使用すると、Tableau Server ノードでローカルディスクを使用する代わりに、ファイルストアのストレージとしてネットワーク共有を使用できます。一元化された場所にストレージを配置することで、ファイルストアノード間でデータを複製するために費やされるネットワークトラフィックの量を大幅に削減できます。たとえば、ファイルストアがローカルディスクを使用している場合、ローカルファイルストアを使用して 1 GB の抽出が更新されると、1 GB のデータがネットワークを介してファイルストアプロセスを実行しているすべてのノードに複製されます。Tableau Server が外部ファイルストアで構成されている場合、1 GB の抽出をネットワーク共有にコピーする必要があるのは 1 回のみで、すべてのファイルストアノードがその単一のコピーにアクセスできます。ストレージを一元化することで、ファイルストアノードで必要なローカルストレージの総量も削減されます。

さらに、Tableau Server バックアップでは、スナップショットテクノロジーを活用して、バックアップを完了する時間を大幅に短縮します。

外部ファイルストアの利点を享受するために専用のデータエンジンノードを構成する必要はありません。ファイルストアノードロールと抽出クエリのインタラクティブノードロールを備えた追加のワークロード管理機能を併用できます。詳細については、Tableau Server 外部ファイルストアトピックを参照してください。

外部ファイルストアは、Tableau Server バージョン 2020.1 以降の Advanced Management で使用できます。

一番上に戻る

フィードバックをお送りいただき、ありがとうございます。

フィードバックは正常に送信されました。ありがとうございます!

Tableau Server on Linux ヘルプ