노드 장애 복구

서버 노드 중 하나에 문제가 있고 다른 노드에 중복 프로세스가 있는 경우 Tableau Server가 계속 실행될 수 있습니다. 사용자는 노드 장애가 발생한 후에도 계속 로그인하고 자신의 콘텐츠를 보고 사용할 수 있지만 장애가 발생한 노드로 인해 성능이 저하될 수 있습니다. 또한, 잘못된 노드가 더 이상 중복되지 않는 프로세스를 실행할 경우 서버에서 치명적인 장애가 발생할 위험이 커집니다. 즉, 가능한 한 빨리 잘못된 노드를 제거하고 교체해야 합니다. 예를 들어 수정할 수 있는 하드웨어 장애와 같이 비교적 짧은 시간 안에 복구 가능한 이유로 노드에 장애가 발생한 경우 아래의 절차를 사용하지 말고 노드 백업을 먼저 시도해야 합니다.

참고: 장애가 발생한 노드가 초기 노드인 경우 Tableau Server 설치에 더 큰 영향을 미칩니다. 초기 노드의 장애를 복구하는 방법에 대한 자세한 내용은 초기 노드 장애 복구를 참조하십시오.

일반 요구 사항

Tableau Server 2020.1 버전은 더욱 향상된 복구 기능을 지원하도록 업데이트되었습니다. 이 항목의 절차는 Tableau Server 2020.1용으로 다시 작성되었습니다.

이전 버전의 Tableau Server에서 장애가 발생한 노드를 복구하려는 경우 해당 버전의 절차를 따라야 합니다. Tableau 도움말의 아카이브된 버전을 보려면 Tableau 도움말(링크가 새 창에서 열림)을 참조하십시오.

  • 파일 저장소 인스턴스를 포함하는 적어도 하나의 작동하는 노드가 있습니다.
  • 리포지토리를 포함하는 적어도 하나의 작동하는 노드가 있습니다.
  • CFS(클라이언트 파일 서비스)를 포함하는 적어도 하나의 작동하는 노드가 있습니다.

참고: 이 작업에는 TSM 명령줄을 사용해야 할 수 있는 단계가 포함되어 있습니다.

장애가 발생한 노드 제거

Tableau Server 클러스터에서 장애가 발생한 노드를 제거하려면

  1. 장애가 발생한 노드를 식별합니다.

    tsm status -v

    장애가 발생한 노드의 상태는 "ERROR"이고 프로세스는 사용 불가능으로 표시됩니다. 노드 ID는 "node<n>"으로 나열되고 그 다음에 컴퓨터 이름이 옵니다. 예를 node3의 경우 다음과 같습니다.

    node3: WIN-OO915SFASVH
    						Status: ERROR
    					'Tableau Server Gateway 0' status is unavailable.
  2. Tableau Server를 중지합니다.

    이 절차의 나머지 부분에는 몇 가지 명령과 함께 --ignore-node-status 옵션이 포함됩니다. --ignore-node-status 옵션을 사용하여 명령을 실행하면 지정된 노드의 상태를 고려하지 않고 명령이 실행됩니다. --ignore-node-status를 사용하려면 장애가 발생한 노드를 지정합니다.

    tsm stop --ignore-node-status <nodeID>

    예를 들어 node3에 장애가 발생한 경우 다음과 같이 명령을 실행합니다.

    tsm stop --ignore-node-status node3
  3. 노드에서 실행 중인 주요 프로세스를 확인합니다.

    • 장애가 발생한 노드가 단일 인스턴스의 메시징 서비스를 실행 중이라면 장애가 발생한 노드에서 서비스를 제거하고 작동하는 노드에 서비스를 추가해야 합니다.

      장애가 발생한 노드에서 제거합니다.

      tsm topology set-process -pr activemqserver -n <nodeID> -c 0
      

      작동하는 노드에 추가합니다.

      tsm topology set-process -pr activemqserver -n <nodeID> -c 1
    • 장애가 발생한 노드가 조정 서비스를 실행 중이라면 노드를 제거하기 전에 새 집합을 배포해야 합니다.

      tsm topology deploy-coordination-service -n <good_nodeID> --ignore-node-status <failed_nodeID>
      
    • 장애가 발생한 노드에서 CFS(클라이언트 파일 서비스)의 단일 인스턴스만 실행된 경우 작동하는 노드에서 새 CFS 인스턴스를 구성해야 합니다. 조정 서비스를 실행하는 모든 노드에 CFS를 구성하는 것이 좋습니다. 자세한 단계는 클라이언트 파일 서비스 구성을 참조하십시오.

    • 장애가 발생한 노드가 파일 저장소를 실행 중이라면 노드를 제거하기 전에 파일 저장소를 강제로 해제하고 제거해야 합니다.

      tsm topology filestore decommission -n <nodeID> --delete-filestore

      보류 중인 변경 내용을 적용합니다(3노드 클러스터와 단일 조정 서비스 인스턴스가 있는 경우 --ignore-warnings 옵션 사용).

      tsm pending-changes apply --ignore-warnings --ignore-node-status <nodeID>
  4. 클러스터가 3노드 클러스터이고 나머지 작업 중인 노드에 리포지토리가 있는 경우 리포지토리 하나를 제거하거나 새 노드를 추가해야 합니다. 이렇게 하는 이유는 노드가 3개 미만인 경우 리포지토리의 단일 인스턴스로 제한되기 때문입니다.

    리포지토리 하나를 제거하려면

    tsm topology set-process -n <nodeID> -pr pgsql -c 0
  5. 명령을 실행하여 장애가 발생한 노드를 제거합니다. 이렇게 하면 변경 내용이 보류 중인 변경 내용 목록에 추가됩니다.

    tsm topology remove-nodes -n <nodeID>
  6. 노드 제거가 보류 중인지 확인합니다.

    tsm pending-changes list
  7. 보류 중인 변경 내용을 적용하여 노드를 제거합니다.

    tsm pending-changes apply 
  8. Tableau Server를 시작합니다.

    tsm start
  9. 새 노드에 Tableau Server를 설치하고 이전의 장애가 발생한 노드가 실행 중이던 프로세스로 노드를 구성합니다.

  10. 새 컴퓨터 또는 Tableau를 완전히 제거한 후 원래 컴퓨터에서 원래 설치 프로그램과 초기 노드에서 생성된 부트스트랩 파일을 사용하여 Tableau를 설치합니다. 이 작업을 수행하는 방법에 대한 자세한 내용은 추가 노드 설치 및 구성을 참조하십시오.

    최상의 방법은 원래 노드에서 장애가 발생했을 때 손실된 모든 프로세스를 구성하여 클러스터가 완전히 이중화되게 하는 것입니다.

  11. 노드를 설치하고 필요한 방식으로 실행한 후 새로운 조정 서비스 집합을 다시 배포해야 합니다. 자세한 내용은 조정 서비스 집합 배포를 참조하십시오.

  12. 마지막으로 아직 이 작업을 수행하지 않은 경우 조정 서비스를 실행하는 모든 노드에 CFS 인스턴스를 추가합니다. 자세한 내용은 클라이언트 파일 서비스 구성을 참조하십시오.클라이언트 파일 서비스 구성