Recupero da un errore del nodo

Se si verifica un problema con uno dei nodi del server e sono presenti processi ridondanti sugli altri nodi, Tableau Server può continuare a funzionare. I tuoi utenti possono sempre accedere e visualizzare e utilizzare i loro contenuti dopo l’errore del nodo, ma potrebbe verificarsi un causa delle prestazioni a causa del nodo non funzionante. Inoltre, il server correrà maggiori rischi di errori catastrofici se il nodo danneggiato stava eseguendo processi non più ridondanti. Questo significa che dovresti rimuovere il nodo non funzionante e sostituirlo il più presto possibile. Se si verifica un errore sul nodo per cause risolvibili in un periodo di tempo relativamente breve (ad esempio, un errore hardware che puoi correggere), è consigliabile tentare prima di tutto il ripristino del nodo senza utilizzare la procedura descritta di seguito.

Nota: se il nodo con errori è il nodo iniziale, le implicazioni per le installazioni di Tableau Server sono maggiori. Per informazioni dettagliate su come eseguire il ripristino da un errore nel nodo iniziale, consulta Recupero da un errore iniziale del nodo.

Requisiti generali

La versione 2020.1 di Tableau Server è stata aggiornata con funzionalità di ripristino migliorate. La procedura illustrata in questo argomento è stata scritta per Tableau Server 2020.1.

Se stai tentando di ripristinare un nodo con errori da una versione precedente di Tableau Server, devi seguire la procedura per la versione corrispondente. Per visualizzare le versioni archiviate della Guida di Tableau, consulta la Guida di Tableau(Il collegamento viene aperto in una nuova finestra).

  • Esiste almeno un nodo funzionante contenente un’istanza dell’archivio file.
  • Esiste almeno un nodo funzionante contenente un repository.
  • Esiste almeno un nodo funzionante contenente il servizio file client (CFS).

Nota: questa operazione include i passaggi che potrebbe essere necessario eseguire utilizzando la riga di comando TSM.

Rimozione di un nodo con errori

Per rimuovere un nodo con errori da un cluster di Tableau Server:

  1. Identifica il nodo con errori:

    tsm status -v

    Il nodo con errori avrà uno stato con valore "ERROR" e i processi saranno visualizzati come non disponibili. L’ID del nodo è elencato come "nodo<n>", seguito dal nome della macchina. Ad esempio, con node3:

    node3: WIN-OO915SFASVH
    						Status: ERROR
    					'Tableau Server Gateway 0' status is unavailable.
  2. Arresta Tableau Server.

    Il resto di questa procedura include alcuni comandi con l’opzione --ignore-node-status. Quando un comando viene eseguito con l’opzione --ignore-node-status, il comando verrà eseguito senza considerare lo stato del nodo specificato. Per utilizzare --ignore-node-status, specifica il nodo con errori:

    tsm stop --ignore-node-status <nodeID>

    Ad esempio, se il nodo 3 è con errori, esegui il comando come segue:

    tsm stop --ignore-node-status node3
  3. Individua eventuali processi chiave che erano in esecuzione sul nodo:

    • Se il nodo con errori stava eseguendo il servizio di messaggistica, devi rimuovere il servizio dal nodo con errori e aggiungerlo a un nodo funzionante.

      Rimuovilo dal nodo con errori:

      tsm topology set-process -pr activemqserver -n <nodeID> -c 0
      

      Per aggiungerlo a un nodo funzionante:

      tsm topology set-process -pr activemqserver -n <nodeID> -c 1
    • Se il nodo con errori stava eseguendo il servizio di coordinamento, devi distribuire un nuovo insieme prima di rimuovere il nodo:

      tsm topology deploy-coordination-service -n <good_nodeID> --ignore-node-status <failed_nodeID>
      
    • Se il nodo con errori eseguiva l’unica istanza del servizio file client (CFS), devi configurare una nuova istanza di CFS in un nodo funzionante. È consigliabile configurare CFS in ogni nodo in cui è in esecuzione il servizio di coordinamento. Per la procedura dettagliata, consulta Configurare servizio file del client.

    • Se il nodo con errori stava eseguendo l’archivio file, forza la disattivazione dell’archivio file e rimuovilo prima di rimuovere il nodo.

      tsm topology filestore decommission -n <nodeID> --delete-filestore

      Applica le modifiche in sospeso (utilizza l’opzione --ignore-warnings se disponi di un cluster di tre nodi e di un’unica istanza del servizio di coordinamento):

      tsm pending-changes apply --ignore-warnings --ignore-node-status <nodeID>
  4. Se il cluster era a tre nodi e sono presenti repository sui restanti nodi funzionanti, rimuovi un repository o aggiungi un nuovo nodo. Questo perché, quando disponi di meno di tre nodi, non puoi avere più di una singola istanza del repository.

    Per rimuovere un repository:

    tsm topology set-process -n <nodeID> -pr pgsql -c 0
  5. Esegui il comando per rimuovere il nodo con errori. In questo modo aggiungi la modifica all’elenco delle modifiche in sospeso:

    tsm topology remove-nodes -n <nodeID>
  6. Verifica che la rimozione del nodo sia in sospeso:

    tsm pending-changes list
  7. Applica le modifiche in sospeso per rimuovere il nodo:

    tsm pending-changes apply 
  8. Avvia Tableau Server:

    tsm start
  9. Installa Tableau Server su un nuovo nodo e configura il nodo con i processi che erano in esecuzione sul vecchio nodo con errori.

  10. In un computer nuovo o nel computer originale dopo la rimozione completa di Tableau, installa Tableau utilizzando il programma di installazione originale e un file di bootstrap generato dal nodo iniziale. Per maggiori informazioni sulla procedura, consulta Installare e configurare nodi aggiuntivi.

    È consigliabile configurare qualsiasi processo perso quando il nodo originale ha avuto esito negativo, per verificare che il cluster sia completamente ridondante.

  11. Una volta che i tuoi nodi sono attivi e funzionanti come desideri, ti consigliamo anche di ridistribuire un nuovo insieme di servizi di coordinamento. Per maggiori informazioni, consulta Implementare un insieme dei servizi di coordinamento.

  12. Infine, se non l’hai già fatto, aggiungi un’istanza di CFS a ogni nodo che esegue il servizio di coordinamento. Per maggiori informazioni, consulta Configurare servizio file del client