Recuperação de falha no nó inicial

O primeiro computador no qual você instalou o Tableau, o "nó inicial”, tem algumas características únicas. Três processos executam apenas no nó inicial e não podem ser movidos para qualquer outro nó exceto em uma situação de falha, o Serviço de Licença (Gerenciador de licenças), o Serviço de Ativação e o Controlador do TSM (Controlador de administração). O Tableau Server inclui um script que automatiza a movimentação desses processos para um dos outros nós existentes, para que obtenha acesso completo de volta ao TSM e mantenha o Tableau Server em execução.

Dois outros processos são inicialmente incluídos no nó inicial, mas podem ser adicionados ou movidos para nós adicionais, o CFS (Serviço de arquivos do cliente) e o Serviço de coordenação. Dependendo de como sua instalação foi configurada com o CFS e o serviço de coordenação, você também pode precisar tomar medidas para reimplantá-los.

Se um nó inicial falhar

Se houver um problema com o nó inicial e você tiver processos redundantes em seus outros nós, não há garantia de que o Tableau Server continuará em execução.

  • O Tableau Server pode continuar em execução por até 72 horas após uma falha inicial do nó, antes que a falta do serviço de licenciamento afete outros processos. Se afetar, seus usuários ainda poderão fazer logon, ver e usar seus conteúdos depois da falha no nó inicial, mas você não poderá reconfigurar o Tableau Server, pois não tem acesso ao Controlador de administração.
  • Se você estiver executando uma versão do Tableau Server 2021.4.2 (ou anterior) configurada para ATR, os problemas com o nó inicial tornarão todas as funcionalidades do servidor indisponíveis. Isso é verdade se o nó tiver um problema ou se você o interromper intencionalmente (por exemplo, para fazer um patch no nível do sistema).

Mesmo quando configurado com processos redundantes, é possível que o Tableau Server não continue a funcionar após a falha do nó inicial. Isso acontece mesmo quando uma instalação é configurada para alta disponibilidade. Isso significa que é necessário mover os dois processos exclusivos para outro nó em execução o mais rápido possível. Se o seu nó inicial falhar por motivos que sejam recuperáveis em uma quantidade de tempo relativamente pequena (por exemplo, uma falha no hardware que você pode corrigir), em primeiro lugar, tente ativar o nó novamente sem usar o procedimento abaixo.

Observação: as etapas neste artigo exigem tempo de inatividade do servidor e podem atrapalhar, então devem ser usar somente no caso uma falha catastrófica do nó inicial. Se não for possível executar o nó inicial novamente, use as seguintes etapas para mover processos principais do TSM para outro nó no cluster.

Requisitos gerais

A versão 2021.1 do Tableau Server foi atualizada com melhor funcionalidade de recuperação. O procedimento neste tópico foi escrito para o Tableau Server 2021.1.

Se você está tentando recuperar um nó falho de uma versão anterior do Tableau Server, siga o procedimento para essa versão. Para ver versões arquivadas da ajuda do Tableau, consulte Ajuda do Tableau(O link abre em nova janela).

  • Como parte do processo de configuração de uma instalação de vários nós do Tableau Server, é necessário ter implantado um ensemble do Serviço de coordenação. O processo abaixo presume a existência de um ensemble do Serviço de coordenação implantado antes do problema com o nó inicial. Para obter mais informações sobre a implantação de um ensemble do Serviço de coordenação, consulte Implantar um ensemble do Serviço de coordenação.
  • Esse processo pressupõe que você configurou instâncias do CFS (Serviço de arquivo do cliente) em cada nó que está executando o Serviço de coordenação. Se você não adicionou instâncias adicionais de CFS, sua única instância estava no nó inicial, e será preciso adicionar pelo menos uma instância de CFS a outro nó. Além disso, será necessário preencher novamente o CFS. O Tableau Server exige pelo menos uma instância do CFS. Para obter mais informações, consulte Configurar Serviço de arquivo do cliente e Serviço de arquivo do cliente do Tableau Server .

Observação: essa operação inclui etapas que talvez precisem ser executadas com a linha de comando do TSM.

Mover o Controlador TSM, Serviço de licença e Serviço de ativação para outro nó

Se houver um problema com o nó inicial, o Controlador TSM, Serviço de licença e Serviço de ativação precisam ser iniciados em outro nó. Siga as etapas a seguir para usar o script fornecido move-tsm-controller e fazer com que o Controlador TSM, Serviço de licença e Serviço de ativação funcionem em outro nó.

  1. Em um nó ainda em funcionamento, execute o script de recuperação do Controlador. Em um prompt de terminal no nó em funcionamento, digite o comando a seguir:

    sudo /opt/tableau/tableau_server/packages/scripts.<version_code>/move-tsm-controller -n <nodeID>

    onde "nodeID" ié a ID do nó no qual deseja que o Controlador TSM seja executado. Por exemplo:

    sudo /opt/tableau/tableau_server/packages/scripts.10400.17.0802.1319/move-tsm-controller -n node2

  2. Verifique se o Controlador de administração está funcionando no nó:

    tsm status -v

  3. Pare o Tableau Server.

    O restante deste procedimento inclui alguns comandos com a opção --ignore-node-status. Quando um comando é executado com a opção --ignore-node-status, o comando será executado sem considerar o status do nó especificado. Para usar --ignore-node-status, especifique o nó com falha:

    tsm stop --ignore-node-status <nodeID>

    Por exemplo, se node1 falhou, execute o seguinte comando:

    tsm stop --ignore-node-status node1

  4. Adicione o Serviço de licença ao nó:

    tsm topology set-process -pr licenseservice -n <nodeID> -c 1

  5. Remova o Serviço de licença antigo do nó original, onde "nodeID" é o nó inicial que falhou:

    tsm topology set-process -pr licenseservice -n <nodeID> -c 0

  6. Se você estiver executando uma das seguintes versões

    • 2023.3.0 ou posterior

    • 2023.1.3 ou posterior

    • 2022.3.7 ou posterior

    • 2022.1.15 ou posterior

    ou se estiver executando uma versão anterior e usando ATR, adicione o serviço de ativação ao novo nó:

    tsm topology set-process -pr activationservice -n <nodeID> -c 1

  7. Se você estiver executando uma dessas versões ou posterior

    • 2023.3.0 ou posterior

    • 2023.1.3 ou posterior

    • 2022.3.7 ou posterior

    • 2022.1.15 ou posterior

    ou estiver executando uma versão anterior e usando ATR, remova o Serviço de ativação antigo do nó original, em que "nodeID" é o nó inicial que falhou:

    tsm topology set-process -pr activationservice -n <nodeID> -c 0

    Importante:Em um cluster, se um nó que está executando sua única instância do CFS falhar, todos os arquivos gerenciados pelo CFS serão perdidos e você precisará preencher novamente esses arquivos do CFS, reimportando certificados e imagens personalizadas e fazendo quaisquer alterações de configuração relacionadas. para obter uma lista de arquivos gerenciados pelo CFS, consulte Serviço de arquivo do cliente do Tableau Server.

  8. Se o nó inicial estiver executando o Serviço de mensagens , adicione o Serviço de mensagens a esse nó:

    tsm topology set-process -pr activemqserver -n node2 -c 1

  9. (Opcional) Além disso, é possível adicionar outros processos que eram executados no nó inicial, mas não estão funcionando neste nó. Por exemplo, para adicionar um servidor cache:

    tsm topology set-process -pr cacheserver -n node2 -c 1

  10. Aplique as alterações:

    tsm pending-changes apply --ignore-node-status <nodeID>

    Se as alterações pendentes exigirem uma reinicialização do servidor, o comando pending-changes apply exibirá um prompt para que você saiba que ocorrerá uma reinicialização. Esse prompt será exibido mesmo que o servidor esteja parado, porém, nesse caso, não há reinicialização. Cancele o prompt com a opção --ignore-prompt, mas isso não altera o comportamento de reinicialização. Se as alterações não exigirem uma reinicialização, elas serão aplicadas sem um prompt. Para obter mais informações, consulte tsm pending-changes apply.

  11. Reinicie o Controlador de administração do TSM (como a conta de sistema do tableau):

    sudo su -l tableau -c "systemctl --user restart tabadmincontroller_0.service"

    Observação: pode demorar alguns minutos para tabadmincontroller reiniciar. Se você tentar aplicar alterações pendentes na próxima etapa, antes que o controlador tenha reiniciado completamente, o TSM não conseguirá se conectar ao controlador. Use o comando tsm status -v para garantir que o controlador esteja funcionando. O Controlador de administração do Tableau Server deve ser listado como "em execução".

  12. Aplique as alterações pendentes (pode parecer não ter nenhuma alteração, mas esta etapa é obrigatória):

    tsm pending-changes apply --ignore-node-status <nodeID>

  13. Ative a licença Tableau Server no novo nó do Controlador:

    tsm licenses activate -k <product-key>

  14. Certifique-se de que a licença esteja ativada adequadamente:

    tsm licenses list

  15. Se o nó inicial estava executando o Serviço de coordenação, implante um novo ensemble do Serviço de coordenação que não inclua esse nó. Se você tiver um cluster de três nós e o nó inicial estiver executando o Serviço de coordenação, implante um novo ensemble do Serviço de coordenação de uma única instância em um nó diferente e limpe o antigo. Neste exemplo, uma única instância do Serviço de coordenação está sendo implantada no segundo nó:

    tsm topology deploy-coordination-service -n node2 --ignore-node-status node1

  16. Se o nó inicial estiver executando uma instância do Armazenamento de arquivos, será necessário removê-la:

    tsm topology filestore decommission -n <nodeID> --delete-filestore

    Onde nodeID é o nó inicial que falhou.

  17. Aplique as alterações pendentes, usando o sinalizador --ignore-warnings, se o novo ensemble do Serviço de coordenação implantado acima for um ensemble de nó único:

    tsm pending-changes apply --ignore-node-status node1 --ignore-warnings

  18. Remova o nó inicial, onde nodeID é o nó inicial que falhou:

    tsm topology remove-nodes -n <nodeID>

  19. Aplique as alterações pendentes, usando o sinalizador --ignore-warnings, se o novo ensemble do Serviço de coordenação implantado acima for um ensemble de nó único:

    tsm pending-changes apply --ignore-warnings

  20. Inicie o Tableau Server:

    tsm start

    Nesse momento, o servidor deverá iniciar e você poderá usar o TSM para configurá-lo. A etapa a seguir é a substituição do nó inicial, para que o cluster tenha a quantidade original de nós. A forma como isso é feito depende de você querer ou não usar novamente o nó que apresentou falha. Recomendamos usar novamente o nó somente se puder identificar a razão da falha e seguir as etapas para impedir que ocorra novamente.

  21. Caso planeje usar o nó original novamente, antes é necessário remover completamente o Tableau dele. Faça isso ao executar o script tableau-server-obliterate. Para obter detalhes, consulte Remover o Tableau Server do computador.

  22. Em outro computador, ou no computador original após remover completamente o Tableau, instale o Tableau usando o Programa de instalação original e um arquivo bootstrap gerado a partir do nó que executa o Controlador de administração e o Serviço de licenciamento. Isso cria um nó adicional que você pode configurar como parte do cluster. Para obter detalhes sobre como adicionar o nó, consulte Instalar e configurar nós adicionais.

    Uma prática recomendada é configurar os processos perdidos durante a falha do nó original, para garantir que o cluster esteja completamente redundante. Você pode querer mover os processos do nó inicial para o novo nó adicional de forma a duplicar a configuração original. Por exemplo, se o nó inicial estava executando somente gateway e Armazenamento de arquivo, você pode querer configurar o nó inicial da mesma forma.

  23. Além disso, é necessário reimplantar um novo ensemble do Serviço de coordenação, uma vez que todos os nós estão funcionando conforme o esperado. Para obter detalhes, consulte Implantar um ensemble do Serviço de coordenação.

  24. Por fim, se você ainda não fez isso, adicione uma instância de CFS a cada nó que está executando o Serviço de coordenação. Para obter mais informações, consulte Configurar Serviço de arquivo do cliente

    Em um cluster, se um nó que está executando sua única instância do CFS falhar, todos os arquivos gerenciados pelo CFS serão perdidos e você precisará preencher novamente esses arquivos do CFS, reimportando certificados e imagens personalizadas e fazendo quaisquer alterações de configuração relacionadas.Para obter uma lista de arquivos gerenciados pelo CFS, consulte Serviço de arquivo do cliente do Tableau Server.

 

Agradecemos seu feedback!Seu feedback foi enviado. Obrigado!