Recuperar-se de uma falha no nó

Se houver um problema com um dos nós do servidor e você tiver processos redundantes em outros nós, o Tableau Server poderá continuar a ser executado. Os usuários poderão fazer logon, além de ver e usar o conteúdo depois da falha no nó, mas poderá ocorrer uma degradação no desempenho como resultado dessa falha. Além disso, o servidor estará com maior risco de falha catastrófica se o nó defeituoso estiver executando processos que não são mais redundantes. Isso significa que você deve remover o nó defeituoso e substituí-lo assim que possível. Se o seu nó falhar por motivos que sejam recuperáveis em uma quantidade de tempo relativamente pequena (por exemplo, uma falha no hardware que você pode corrigir), em primeiro lugar, tente ativar o nó novamente sem usar o procedimento abaixo.

Observação: se o nó com falha for o nó inicial, haverá implicações maiores para as instalações do Tableau Server. Para obter detalhes sobre como se recuperar da falha em um nó inicial, consulte Recuperação de falha no nó inicial.

Requisitos gerais

A versão 2020.1 do Tableau Server foi atualizada com melhor funcionalidade de recuperação. O procedimento neste tópico foi escrito para o Tableau Server 2020.1.

Se você está tentando recuperar um nó falho de uma versão anterior do Tableau Server, siga o procedimento para essa versão. Para ver versões arquivadas da ajuda do Tableau, consulte Ajuda do Tableau(O link abre em nova janela).

  • Existe pelo menos um nó funcionando com uma instância do Armazenamento de arquivos.
  • Existe pelo menos um nó funcionando com um Repositório.
  • Existe pelo menos um nó funcionando com o Serviço de arquivo do cliente (CSF) nele.

Observação: essa operação inclui etapas que talvez precisem ser executadas com a linha de comando do TSM. Para usar a CLI do TSM, é necessário ter acesso de administrador à linha de comando em um dos nós em sua instalação e credenciais de administrador do TSM para executar comandos do TSM.

Remoção de um nó com falha

Para remover um nó com falha de um cluster do Tableau Server:

  1. Identifique o nó com falha:

    tsm status -v

    O nó com falha terá um status de "ERRO" e os processos serão exibidos como indisponíveis. A ID do nó é listada como "node<n>", seguida do nome da máquina. Por exemplo, node3:

    node3: WIN-OO915SFASVH
    						Status: ERROR
    					'Tableau Server Gateway 0' status is unavailable.
  2. Interrompa o Tableau Server.

    O restante deste procedimento inclui alguns comandos com a opção --ignore-node-status. Quando um comando é executado com a opção --ignore-node-status, o comando será executado sem considerar o status do nó especificado. Para usar --ignore-node-status, especifique o nó com falha:

    tsm stop --ignore-node-status <nodeID>

    Por exemplo, se node3 falhou, execute o seguinte comando:

    tsm stop --ignore-node-status node3
  3. Determine os principais processos que estavam em execução no nó:

    • Se o nó com falha estava executando o Serviço de mensagens, é necessário remover o serviço do nó com falha e adicioná-lo a um nó de trabalho.

      Remova-o do nó com falha:

      tsm topology set-process -pr activemqserver -n <nodeID> -c 0
      

      Adicione-o a um nó de trabalho:

      tsm topology set-process -pr activemqserver -n <nodeID> -c 1
    • Se o nó com falha estava executando o Serviço de coordenação, será necessário implantar um novo ensemble antes de remover o nó.

      tsm topology deploy-coordination-service -n <good_nodeID> --ignore-node-status <failed_nodeID>
      
    • Se o nó com falha estava executando a única instância do Client File Service (Serviço de arquivo do cliente, CFS), será preciso configurar uma nova instância de CFS em um nó em funcionamento. Recomendamos que você configure o CFS em cada nó que esteja executando o Serviço de coordenação. Para obter as etapas de detalhes, consulte Configurar Serviço de arquivo do cliente.

    • Se o nó com falha estava executando o Armazenamento de arquivos, será necessário forçar a desativação do Armazenamento de arquivos e removê-lo antes de remover o nó.

      tsm topology filestore decommission -n <nodeID> --delete-filestore

      Aplique as alterações pendentes (use a opção --ignore-warnings se você tiver um cluster de três nós e uma única instância do Serviço de coordenação):

      tsm pending-changes apply --ignore-warnings --ignore-node-status <nodeID>
  4. Se o cluster for de três nós e houver repositórios nos nós de trabalho restantes, será necessário remover um repositório ou adicionar um novo nó. Isso ocorre porque você está limitado a uma única instância do repositório se tiver menos de três nós.

    Para remover um repositório:

    tsm topology set-process -n <nodeID> -pr pgsql -c 0
  5. Execute o comando para remover o nó com falha. Isso adiciona a alteração à lista de alterações pendentes:

    tsm topology remove-nodes -n <nodeID>
  6. Verifique se a remoção do nó está pendente:

    tsm pending-changes list
  7. Aplicar as alterações pendentes para remover o nó:

    tsm pending-changes apply 
  8. Inicie o Tableau Server:

    tsm start
  9. Instale o Tableau Server em um novo nó e configure-o com os processos em execução no nó antigo com falha.

  10. Em outro computador, ou no computador original após remover completamente o Tableau, instale o Tableau usando o Programa de instalação original e um arquivo bootstrap gerado no nó inicial. Para obter detalhes sobre como fazer isso, consulte Instalar e configurar nós adicionais.

    Uma prática recomendada é configurar os processos perdidos durante a falha do nó original, para garantir que o cluster esteja completamente redundante.

  11. Além disso, é necessário reimplantar um novo ensemble do Serviço de coordenação, uma vez que todos os nós estão funcionando conforme o esperado. Para obter detalhes, consulte Implantar um ensemble do Serviço de coordenação.

  12. Por fim, se você ainda não fez isso, adicione uma instância de CFS a cada nó que está executando o Serviço de coordenação. Para obter mais informações, consulte Configurar Serviço de arquivo do cliente