ノードの障害からの回復

サーバー ノードのいずれかに問題があり、他のノードに冗長プロセスがある場合、Tableau Server は引き続き実行可能です。ユーザーは引き続きサインインし、ノード障害発生後にコンテンツを表示して使用することはできますが、ノード障害のためにパフォーマンスが低下する場合があります。また、不適切なノードが冗長性のなくなったプロセスを実行している場合、サーバーが致命的な障害にさらされるリスクが大きくなります。つまり、不適切なノードを取り除き、可能な限り早くそのノードを置き換える必要があります。相対的に時間が足りず復元できないという理由でノードに障害が発生する場合 (修正できるハードウェアのエラーなど)、まずは以下の手順を実行せずにノードのバックアップを試行する必要があります。

注: 障害が発生したノードが最初のノードの場合、Tableau Server インストールには大きな影響があります。最初のノードの障害から復旧する方法について詳細は、初期ノードの障害からの回復を参照してください。

一般的な要件

Tableau Server バージョン 2020.1 では回復機能が強化されました。このトピックの手順は、Tableau Server 2020.1 用に作成されています。

障害が発生したノードを以前のバージョンの Tableau Server から復元しようとしている場合は、そのバージョン用の手順に従う必要があります。Tableau ヘルプのアーカイブ バージョンを表示するには、Tableau ヘルプ(新しいウィンドウでリンクが開く)を参照してください。

  • ファイル ストアのインスタンスが存在する機能しているノードが 1 つ以上あること。
  • リポジトリが存在する機能しているノードが 1 つ以上あること。
  • クライアント ファイル サービス (CFS) が存在する機能しているノードが 1 つ以上あること。

注: この操作には、TSM コマンド ラインを使用して実行する必要のある手順が含まれています。TSM CLI を使用するには、インストール済みノードのいずれかでコマンド ラインにアクセスするための管理者アクセス権限と、TSM コマンドを実行するための TSM 管理者認証資格情報が必要です。

障害が発生したノードの削除

Tableau Server クラスタから障害が発生したノードを削除するには:

  1. 障害が発生したノードを特定します。

    tsm status -v

    障害が発生したノードのステータスは "ERROR (エラー)" となり、プロセスは使用不可と表示されます。ノード ID は "node<n>" と記載され、その後にマシン名が続きます。たとえば、node3 では以下のようになります。

    node3: WIN-OO915SFASVH
    						Status: ERROR
    					'Tableau Server Gateway 0' status is unavailable.
  2. Tableau Server を停止します。

    この手順の残りの部分には、--ignore-node-status オプションを使用する一部のコマンドが含まれています。--ignore-node-statusオプションを使用してコマンドを実行すると、指定されたノードの状況を考慮せずにコマンドが実行されます。--ignore-node-statusを使用するには、障害が発生したノードを指定します。

    tsm stop --ignore-node-status <nodeID>

    たとえば、node3 に障害が発生した場合は、次のコマンドを実行します。

    tsm stop --ignore-node-status node3
  3. ノード上で実行されていた主要なプロセスを判断します。

    • 障害が発生したノードがメッセージング サービスを実行していた場合は、障害が発生したノードからサービスを削除し、それを機能しているノードに追加する必要があります。

      障害が発生したノードから削除します。

      tsm topology set-process -pr activemqserver -n <nodeID> -c 0
      

      次の機能しているノードに追加します。

      tsm topology set-process -pr activemqserver -n <nodeID> -c 1
    • 障害が発生したノードが調整サービスを実行していた場合、そのノードを削除する前に、新しいアンサンブルを展開する必要があります。

      tsm topology deploy-coordination-service -n <good_nodeID> --ignore-node-status <failed_nodeID>
      
    • 障害が発生したノードがクライアント ファイル サービス (CFS) のインスタンスのみを実行していた場合、機能するノードで CFS の新しいインスタンスを作成する必要があります。調整サービスを実行しているすべてのノードに CFS を設定することをお勧めします。詳細については、クライアント ファイル サービスの構成を参照してください。

    • 障害が発生したノードがファイル ストアを実行していた場合、ノードを削除する前に、強制的にファイル ストアをコミッション解除して削除する必要があります。

      tsm topology filestore decommission -n <nodeID> --delete-filestore

      保留中の変更を適用します (3 ノード クラスタと単一の調整サービス インスタンスがある場合は、--ignore-warnings オプションを使用します):

      tsm pending-changes apply --ignore-warnings --ignore-node-status <nodeID>
  4. クラスタが 3 ノード クラスタであり、動作している残りのノードにリポジトリがある場合、1 つのリポジトリを削除するか、新しいノードを追加する必要があります。ノード数が 3 未満の場合、ユーザーは単一インスタンスのリポジトリに制限されるためです。

    1 つのリポジトリを削除するには、次を実行します。

    tsm topology set-process -n <nodeID> -pr pgsql -c 0
  5. コマンドを実行し、障害が発生したノードを削除します。これにより、保留中の変更のリストに変更が追加されます。

    tsm topology remove-nodes -n <nodeID>
  6. ノードの削除が保留中であることを確認してください。

    tsm pending-changes list
  7. 保留中の変更を適用し、ノードを削除します。

    tsm pending-changes apply 
  8. Tableau Server を起動します。

    tsm start
  9. 新しいノードに Tableau Server をインストールし、このノードにおいて、障害が発生した古いノードで実行していたプロセスを構成します。

  10. 新しいコンピューターまたは Tableau を完全に削除した後の元のコンピューターで、元のセットアップ プログラムと、最初のノードから生成された bootstrap ファイルを使用して Tableau をインストールします。この実行方法の詳細については、追加のノードのインストールと構成を参照してください。

    ベスト プラクティスは、元のノードでエラーが発生したときに失ったプロセスを構成し、クラスタでの十分な冗長性を確保することです。

  11. 必要な方法でノードを起動して実行したら、新しい調整サービス アンサンブルの再展開も必要です。詳細は、調整サービス アンサンブルの展開を参照してください。

  12. 最後に、まだ実施していない場合は、調整サービスを実行しているすべてのノードに CFS のインスタンスを追加します。詳細については、クライアント ファイル サービスの構成を参照してください。クライアント ファイル サービスの構成