노드 장애 복구

서버 노드 중 하나에 문제가 있고 다른 노드에 중복 프로세스가 있는 경우 Tableau Server가 계속 실행될 수 있습니다. 사용자는 노드 장애가 발생한 후에도 계속 로그인하고 자신의 콘텐츠를 보고 사용할 수 있지만 장애가 발생한 노드로 인해 성능이 저하될 수 있습니다. 또한, 잘못된 노드가 더 이상 중복되지 않는 프로세스를 실행할 경우 서버에서 치명적인 장애가 발생할 위험이 커집니다. 즉, 가능한 한 빨리 잘못된 노드를 제거하고 교체해야 합니다. 예를 들어 수정할 수 있는 하드웨어 장애와 같이 비교적 짧은 시간 안에 복구 가능한 이유로 노드에 장애가 발생한 경우 아래의 절차를 사용하지 말고 노드 백업을 먼저 시도해야 합니다.

참고: 장애가 발생한 노드가 초기 노드인 경우 Tableau Server 설치에 더 큰 영향을 미칩니다. 초기 노드의 장애를 복구하는 방법에 대한 자세한 내용은 초기 노드 장애 복구를 참조하십시오.

일반 요구 사항

Tableau Server 2020.1 버전은 더욱 향상된 복구 기능을 지원하도록 업데이트되었습니다. 이 항목의 절차는 Tableau Server 2020.1용으로 다시 작성되었습니다.

이전 버전의 Tableau Server에서 장애가 발생한 노드를 복구하려는 경우 해당 버전의 절차를 따라야 합니다. Tableau 도움말의 아카이브된 버전을 보려면 Tableau 도움말(링크가 새 창에서 열림)을 참조하십시오.

  • 파일 저장소 인스턴스를 포함하는 적어도 하나의 작동하는 노드가 있습니다.
  • 리포지토리를 포함하는 적어도 하나의 작동하는 노드가 있습니다.
  • CFS(클라이언트 파일 서비스)를 포함하는 적어도 하나의 작동하는 노드가 있습니다.

참고: 이 작업에는 TSM 명령줄을 사용해야 할 수 있는 단계가 포함되어 있습니다. TSM CLI를 사용하려면 설치의 노드 중 하나에서 관리자 권한으로 명령줄에 액세스하고 TSM 관리자 자격 증명을 사용하여 TSM 명령을 실행해야 합니다.

장애가 발생한 노드 제거

Tableau Server 클러스터에서 장애가 발생한 노드를 제거하려면

  1. 장애가 발생한 노드를 식별합니다.

    tsm status -v

    장애가 발생한 노드의 상태는 "ERROR"이고 프로세스는 사용 불가능으로 표시됩니다. 노드 ID는 "node<n>"으로 나열되고 그 다음에 컴퓨터 이름이 옵니다. 예를 node3의 경우 다음과 같습니다.

    node3: WIN-OO915SFASVH
    						Status: ERROR
    					'Tableau Server Gateway 0' status is unavailable.
  2. Tableau Server를 중지합니다.

    이 절차의 나머지 부분에는 몇 가지 명령과 함께 --ignore-node-status 옵션이 포함됩니다. --ignore-node-status 옵션을 사용하여 명령을 실행하면 지정된 노드의 상태를 고려하지 않고 명령이 실행됩니다. --ignore-node-status를 사용하려면 장애가 발생한 노드를 지정합니다.

    tsm stop --ignore-node-status <nodeID>

    예를 들어 node3에 장애가 발생한 경우 다음과 같이 명령을 실행합니다.

    tsm stop --ignore-node-status node3
  3. 노드에서 실행 중인 주요 프로세스를 확인합니다.

    • 장애가 발생한 노드가 단일 인스턴스의 메시징 서비스를 실행 중이라면 장애가 발생한 노드에서 서비스를 제거하고 작동하는 노드에 서비스를 추가해야 합니다.

      장애가 발생한 노드에서 제거합니다.

      tsm topology set-process -pr activemqserver -n <nodeID> -c 0
      

      작동하는 노드에 추가합니다.

      tsm topology set-process -pr activemqserver -n <nodeID> -c 1
    • 장애가 발생한 노드가 조정 서비스를 실행 중이라면 노드를 제거하기 전에 새 집합을 배포해야 합니다.

      tsm topology deploy-coordination-service -n <good_nodeID> --ignore-node-status <failed_nodeID>
      
    • 장애가 발생한 노드에서 CFS(클라이언트 파일 서비스)의 단일 인스턴스만 실행된 경우 작동하는 노드에서 새 CFS 인스턴스를 구성해야 합니다. 조정 서비스를 실행하는 모든 노드에 CFS를 구성하는 것이 좋습니다. 자세한 단계는 클라이언트 파일 서비스 구성을 참조하십시오.

    • 장애가 발생한 노드가 파일 저장소를 실행 중이라면 노드를 제거하기 전에 파일 저장소를 강제로 해제하고 제거해야 합니다.

      tsm topology filestore decommission -n <nodeID> --delete-filestore

      보류 중인 변경 내용을 적용합니다(3노드 클러스터와 단일 조정 서비스 인스턴스가 있는 경우 --ignore-warnings 옵션 사용).

      tsm pending-changes apply --ignore-warnings --ignore-node-status <nodeID>
  4. 클러스터가 3노드 클러스터이고 나머지 작업 중인 노드에 리포지토리가 있는 경우 리포지토리 하나를 제거하거나 새 노드를 추가해야 합니다. 이렇게 하는 이유는 노드가 3개 미만인 경우 리포지토리의 단일 인스턴스로 제한되기 때문입니다.

    리포지토리 하나를 제거하려면

    tsm topology set-process -n <nodeID> -pr pgsql -c 0
  5. 명령을 실행하여 장애가 발생한 노드를 제거합니다. 이렇게 하면 변경 내용이 보류 중인 변경 내용 목록에 추가됩니다.

    tsm topology remove-nodes -n <nodeID>
  6. 노드 제거가 보류 중인지 확인합니다.

    tsm pending-changes list
  7. 보류 중인 변경 내용을 적용하여 노드를 제거합니다.

    tsm pending-changes apply 
  8. Tableau Server를 시작합니다.

    tsm start
  9. 새 노드에 Tableau Server를 설치하고 이전의 장애가 발생한 노드가 실행 중이던 프로세스로 노드를 구성합니다.

  10. 새 컴퓨터 또는 Tableau를 완전히 제거한 후 원래 컴퓨터에서 원래 설치 프로그램과 초기 노드에서 생성된 부트스트랩 파일을 사용하여 Tableau를 설치합니다. 이 작업을 수행하는 방법에 대한 자세한 내용은 추가 노드 설치 및 구성을 참조하십시오.

    최상의 방법은 원래 노드에서 장애가 발생했을 때 손실된 모든 프로세스를 구성하여 클러스터가 완전히 이중화되게 하는 것입니다.

  11. 노드를 설치하고 필요한 방식으로 실행한 후 새로운 조정 서비스 집합을 다시 배포해야 합니다. 자세한 내용은 조정 서비스 집합 배포를 참조하십시오.

  12. 마지막으로 아직 이 작업을 수행하지 않은 경우 조정 서비스를 실행하는 모든 노드에 CFS 인스턴스를 추가합니다. 자세한 내용은 클라이언트 파일 서비스 구성을 참조하십시오.클라이언트 파일 서비스 구성