Recuperação de falha no nó inicial

O primeiro computador que o Tableau será instalado, o "nó inicial," tem algumas características únicas. Dois processos são executados apenas no nó inicial e não podem ser movidos para nenhum outro nó, exceto em uma situação de falha, o serviço de Licença (Gerenciador de licença) e o Controlador TSM (Controlador de administração). O Tableau Server inclui um script que automatiza a movimentação desses dois processos para um dos outros nós existentes, para que obtenha acesso completo de volta ao TSM e mantenha o Tableau Server em execução.

Dois outros processos são inicialmente incluídos no nó inicial, mas podem ser adicionados ou movidos para nós adicionais, o CFS (Serviço de arquivo do cliente) e o Serviço de coordenação. De acordo com a forma como a instalação foi configurada com o CFS (Client File Service) e o Serviço de coordenação, talvez também seja necessário executar etapas para reimplantá-los.

Se houver um problema com o nó inicial e tiver processos redundantes nos outros nós, o Tableau Server pode continuar a execução por até 72 horas antes que a falta do serviço de licenciamento afete outros processos. Os usuários ainda poderão fazer logon, ver e usar seus conteúdos depois da falha no nó inicial, mas você não poderá reconfigurar o Tableau Server, pois não tem acesso ao Controlador de administração. Isso significa que é necessário mover os dois processos exclusivos para outro nó em execução o mais rápido possível. Se o seu nó inicial falhar por motivos que sejam recuperáveis em uma quantidade de tempo relativamente pequena (por exemplo, uma falha no hardware que você pode corrigir), em primeiro lugar, tente ativar o nó novamente sem usar o procedimento abaixo.

Observação: as etapas neste artigo exigem tempo de inatividade do servidor e podem atrapalhar, então devem ser usar somente no caso uma falha catastrófica do nó inicial. Se não for possível executar o nó inicial novamente, use as seguintes etapas para mover processos principais do TSM para outro nó no cluster.

Requisitos gerais

  • Se o nó inicial estava executando a única instância do Client File Service (Serviço de arquivo do cliente, CFS), será preciso adicionar esse processo a outro nó. O Tableau Server exige pelo menos uma instância do CFS. Para obter mais informações, consulte Configurar Serviço de arquivo do cliente.
  • Como parte do processo de configuração de uma instalação de vários nós do Tableau Server, é necessário ter implantado um ensemble do Serviço de coordenação. O processo abaixo presume a existência de um ensemble do Serviço de coordenação implantado antes do problema com o nó inicial. Para obter mais informações sobre a implantação de um ensemble do Serviço de coordenação, consulte Implantar um ensemble do Serviço de coordenação.

Observação: esta operação inclui etapas que você poderá ter de executar com a linha de comando do TSM. Para usar a CLI do TSM, é necessário ter acesso de administrador à linha de comando em um dos nós em sua instalação e credenciais de administrador do TSM para executar comandos do TSM.

Mover o Controlador TSM e Serviço de licença para outro nó

Se houver um problema com o nó inicial, o Controlador TSM e o Serviço de licença precisam ser iniciados em outro nó. Siga as etapas a seguir para usar o script fornecido move-tsm-controller e fazer com que o Controlador e o Serviço de licença funcionem em outro nó.

  1. Em um nó ainda em funcionamento, execute o script de recuperação do Controlador. Para isso, abra um prompt de comando, navegue até o diretório de script do Tableau Server (Como padrão:C:\Program Files\Tableau\Tableau Server\packages\scripts.<version_code>\ ) e digite o seguinte comando:

    move-tsm-controller -n <nodeID>

    onde "nodeID" ié a ID do nó no qual deseja que o Controlador TSM seja executado. Por exemplo:

    move-tsm-controller -n node2

  2. Feche e abra novamente a janela de comando e verifique se o Controlador de administração está em execução no nó ao digitar o seguinte comando:

    tsm status -v

  3. Interrompa o Tableau Server:

    tsm stop

  4. Adicione o Serviço de licença ao nó:

    tsm topology set-process -pr licenseservice -n <nodeID> -c 1

  5. Remova o Serviço de licença antigo do nó original, onde "nodeID" é o nó inicial que falhou:

    tsm topology set-process -pr licenseservice -n <nodeID> -c 0

  6. Se o nó inicial estiver executando a única instância do CFS, adicione o CFS a este nó:

    tsm topology set-process -pr clientfileservice -n node2 -c 1

  7. Se o nó inicial estiver executando o Serviço de mensagens , adicione o Serviço de mensagens a esse nó:

    tsm topology set-process -pr activemqserver -n node2 -c 1

  8. (Opcional) Além disso, é possível adicionar outros processos que eram executados no nó inicial, mas não estão funcionando neste nó. Por exemplo, para adicionar um servidor cache:

    tsm topology set-process -pr cacheserver -n node2 -c 1

  9. Aplique as alterações:

    tsm pending-changes apply

    O comando pending-changes apply exibe um prompt para informar que reiniciará o Tableau Server se o servidor estiver em execução. O prompt será exibido mesmo que o servidor esteja parado, porém, nesse caso, não há reinicialização. Cancele o prompt com a opção --ignore-prompt, mas isso não altera o comportamento de reinicialização. Para obter mais informações, consulte tsm pending-changes apply.

  10. Reinicie o Controlador de administração do TSM:

    net stop tabadmincontroller_0

    net start tabadmincontroller_0

    Observação: você deve executar esses comandos como administrador em um prompt de comando. Dependendo da configuração do computador, talvez seja necessário executá-los na pasta C:\Windows\System32.

    Observação: pode demorar alguns minutos para tabadmincontroller reiniciar. Se você tentar aplicar alterações pendentes na próxima etapa, antes que o controlador tenha reiniciado completamente, o TSM não conseguirá se conectar ao controlador. Use o comando tsm status -v para garantir que o controlador esteja funcionando. O Controlador de administração do Tableau Server deve ser listado como "em execução".

  11. Aplique as alterações pendentes (pode parecer não ter nenhuma alteração, mas esta etapa é obrigatória):

    tsm pending-changes apply

  12. Ative a licença Tableau Server no novo nó do Controlador:

    tsm licenses activate -k <product-key>

  13. Certifique-se de que a licença esteja ativada adequadamente:

    tsm licenses list

  14. Se o nó inicial estava executando o Serviço de coordenação, implante um novo ensemble do Serviço de coordenação que não inclua esse nó. Se você tiver um cluster de três nós e o nó inicial estiver executando o Serviço de coordenação, implante um novo ensemble do Serviço de coordenação de uma única instância em um nó diferente e limpe o antigo. Neste exemplo, uma única instância do Serviço de coordenação está sendo implantada no segundo nó:

    tsm topology deploy-coordination-service -n <nodeID2>

    Aguarde até que o servidor seja completamente comutado para o novo ensemble.

  15. Quando o servidor tiver sido comutado para o novo ensemble, limpe o antigo.

    Importante: não faça isso logo. Aguarde até que o servidor tenha sido completamente comutado para o novo ensemble, antes de executar o comando de limpeza ou você pode interromper permanentemente o Tableau. Para obter mais informações sobre como implantar um ensemble de Serviço de coordenação, incluindo instruções detalhadas sobre como determinar se o servidor está pronto para limpar o ensemble antigo, consulte Implantar um ensemble do Serviço de coordenação.

    tsm topology cleanup-coordination-service

  16. Se o nó inicial estiver executando uma instância do Armazenamento de arquivos, será necessário removê-la:

    tsm topology filestore decommission -n <nodeID> --delete-filestore

    Onde nodeID é o nó inicial que falhou.

  17. Aplique as alterações pendentes, usando o sinalizador --ignore-warnings, se o novo ensemble do Serviço de coordenação implantado acima for um ensemble de nó único:

    tsm pending-changes apply --ignore-warnings

  18. Remova o nó inicial, onde nodeID é o nó inicial que falhou:

    tsm topology remove-nodes -n <nodeID>

  19. Aplique as alterações pendentes, usando o sinalizador --ignore-warnings, se o novo ensemble do Serviço de coordenação implantado acima for um ensemble de nó único:

    tsm pending-changes apply --ignore-warnings

  20. Inicie o Tableau Server:

    tsm start

    Nesse momento, o servidor deverá iniciar e você poderá usar o TSM para configurá-lo. A etapa a seguir é a substituição do nó inicial, para que o cluster tenha a quantidade original de nós. A forma como isso é feito depende de você querer ou não usar novamente o nó que apresentou falha. Recomendamos usar novamente o nó somente se puder identificar a razão da falha e seguir as etapas para impedir que ocorra novamente.

  21. Caso planeje usar o nó original novamente, antes é necessário remover completamente o Tableau dele. Faça isso ao executar o script tableau-server-obliterate. Para obter detalhes, consulte Remover o Tableau Server do computador.

  22. Em outro computador, ou no computador original após remover completamente o Tableau, instale o Tableau usando o Programa de instalação original e um arquivo bootstrap gerado a partir do nó que executa o Controlador de administração e o Serviço de licenciamento. Isso cria um nó adicional que você pode configurar como parte do cluster. Para obter detalhes sobre como adicionar o nó, consulte Instalar e configurar nós adicionais.

    Uma prática recomendada é configurar os processos perdidos durante a falha do nó original, para garantir que o cluster esteja completamente redundante. Você pode querer mover os processos do nó inicial para o novo nó adicional de forma a duplicar a configuração original. Por exemplo, se o nó inicial estava executando somente gateway e Armazenamento de arquivo, você pode querer configurar o nó inicial da mesma forma.

  23. Além disso, é necessário reimplantar um novo ensemble do Serviço de coordenação, uma vez que todos os nós estão funcionando conforme o esperado. Para obter detalhes, consulte Implantar um ensemble do Serviço de coordenação.

 

Agradecemos seu feedback! Ocorreu um erro ao enviar o feedback. Tente novamente ou envie-nos uma mensagem.