Recupero da un errore iniziale del nodo

Il primo computer su cui si installa Tableau, il "nodo iniziale", ha alcune caratteristiche uniche. Tre processi, il servizio licenze (Gestione licenze), il servizio di attivazione e il controller TSM (Controller di amministrazione), vengono eseguiti solo sul nodo iniziale e non possono essere spostati su nessun altro nodo, se non in caso di guasto. Tableau Server include uno script che consente di automatizzare lo spostamento di questi processi in uno degli altri nodi esistenti, in modo da recuperare un accesso completo a TSM e mantenere Tableau Server in esecuzione.

Altri due processi, CFS (Client File Service) e il servizio di coordinamento, sono inizialmente inclusi nel nodo iniziale ma si possono aggiungere o spostare in altri nodi. A seconda della modalità di configurazione dell’installazione con CFS e il servizio di coordinamento, potrebbe essere necessario adottare misure per rinnovare la distribuzione.

In caso di problemi del nodo iniziale

Se si verifica un problema con il nodo iniziale e sono presenti processi ridondanti sugli altri nodi, non è garantito che Tableau Server continui a funzionare.

  • Tableau Server può continuare a funzionare fino a 72 ore dopo un errore del nodo iniziale, prima che la mancanza del servizio di gestione licenze influisca su altri processi. In tal caso, gli utenti potrebbero continuare a effettuare l’accesso e a visualizzare e a utilizzare il loro contenuto dopo il problema nel nodo iniziale, ma non potrai riconfigurare Tableau Server perché non disporrai più dell’accesso al controller di amministrazione.
  • Se esegui una versione di Tableau Server 2021.4.2 (o precedente) configurata per ATR, i problemi relativi al nodo iniziale renderanno non disponibili tutte le funzionalità del server. Questo vale sia che il nodo presenti un problema sia che tu lo arresti intenzionalmente, ad esempio per applicare una patch a livello di sistema.

Anche se configurato con processi ridondanti, Tableau Server potrebbe non continuare a funzionare dopo un problema nel nodo iniziale. Questo vale anche quando un’installazione è configurata per la disponibilità elevata. Ciò significa che dovresti spostare il prima possibile i due processi univoci in un altro nodo in esecuzione. Se il nodo iniziale ha esito negativo per motivi che sono recuperabili in un periodo di tempo relativamente breve (ad esempio, un errore hardware che puoi correggere), è consigliabile che tu prima tenti il ripristino del nodo senza utilizzare la procedura descritta di seguito.

Nota: i passaggi illustrati in questo articolo richiedono tempi di inattività del server e possono quindi creare interruzioni, pertanto devono essere utilizzati solo in caso di errore irreversibile del nodo iniziale. Se non riesci a recuperare il nodo iniziale, utilizza la procedura seguente per spostare i processi TSM chiave in un altro nodo del cluster.

Requisiti generali

La versione 2021.1 di Tableau Server è stata aggiornata con funzionalità di ripristino migliorate. La procedura illustrata in questo argomento è stata scritta per Tableau Server 2021.1.

Se stai tentando di ripristinare un nodo con errori da una versione precedente di Tableau Server, devi seguire la procedura per la versione corrispondente. Per visualizzare le versioni archiviate della Guida di Tableau, consulta la Guida di Tableau(Il collegamento viene aperto in una nuova finestra).

  • Come parte del processo di configurazione di un’installazione multinodo di Tableau Server , è necessario aver implementato un insieme dei servizi di coordinamento. Il processo seguente presume che fosse stato implementato un insieme dei servizi di coordinamento, prima che si verificasse un problema con il nodo iniziale. Per maggiori informazioni sull’implementazione di un insieme dei servizi di coordinamento, consulta Implementare un insieme dei servizi di coordinamento.
  • Questo processo presuppone che siano state configurate istanze del servizio file client (CFS) in ogni nodo che esegue il servizio di coordinamento. Se non sono state aggiunte ulteriori istanze di CFS, l’unica istanza si trova nel nodo iniziale e sarà necessario aggiungere almeno un’istanza di CFS a un altro nodo. Dovrai anche ripopolare CFS. Tableau Server richiede almeno un’istanza di CFS. Per maggiori informazioni, consulta Configurare servizio file del client e Servizio file client di Tableau Server.

Nota: questa operazione include i passaggi che potrebbe essere necessario eseguire utilizzando la riga di comando TSM.

Spostare il controller TSM, il servizio licenze e il servizio di attivazione in un altro nodo

In caso di problemi con il nodo iniziale, il controller TSM, il servizio licenze e il servizio di attivazione dovranno essere avviati in un altro nodo. Per utilizzare lo script move-tsm-controller fornito e avviare il controller TSM, il servizio licenze e il servizio di attivazione in un altro nodo, esegui questa procedura.

  1. Su un nodo ancora funzionante, esegui lo script di ripristino del controller. Al prompt dei comandi in un nodo attivo, digita il comando seguente:

    sudo /opt/tableau/tableau_server/packages/scripts.<version_code>/move-tsm-controller -n <nodeID>

    dove "nodeID" è l’ID del nodo sul quale vuoi eseguire il controller TSM. Ad esempio:

    sudo /opt/tableau/tableau_server/packages/scripts.10400.17.0802.1319/move-tsm-controller -n node2

  2. Verifica che il controller di amministrazione sia in esecuzione sul nodo:

    tsm status -v

  3. Arresta Tableau Server.

    Il resto di questa procedura include alcuni comandi con l’opzione --ignore-node-status. Quando un comando viene eseguito con l’opzione --ignore-node-status, il comando verrà eseguito senza considerare lo stato del nodo specificato. Per utilizzare --ignore-node-status, specifica il nodo con errori:

    tsm stop --ignore-node-status <nodeID>

    Ad esempio, se il nodo 1 è con errori, esegui il comando come segue:

    tsm stop --ignore-node-status node1

  4. Aggiungi il servizio di gestione licenze al nodo:

    tsm topology set-process -pr licenseservice -n <nodeID> -c 1

  5. Rimuovi il precedente servizio di gestione licenze dal nodo originale, dove "nodeID" è il nodo iniziale che ha avuto esito negativo:

    tsm topology set-process -pr licenseservice -n <nodeID> -c 0

  6. Se esegui una delle seguenti versioni:

    • 2023.3.0 o versioni successive

    • 2023.1.3 o versioni successive

    • 2022.3.7 o versioni successive

    • 2022.1.15 o versioni successive

    o esegui una versione precedente e utilizzi l’ATR, aggiungi il servizio di attivazione al nuovo nodo:

    tsm topology set-process -pr activationservice -n <nodeID> -c 1

  7. Se esegui una di queste versioni:

    • 2023.3.0 o versioni successive

    • 2023.1.3 o versioni successive

    • 2022.3.7 o versioni successive

    • 2022.1.15 o versioni successive

    o esegui una versione precedente e utilizzi l’ATR, rimuovi il precedente servizio di attivazione dal nodo originale, dove “nodeID” è il nodo iniziale che ha avuto esito negativo:

    tsm topology set-process -pr activationservice -n <nodeID> -c 0

    Importante: In un cluster, se si verifica un problema in un nodo che esegue l’unica istanza di CFS, tutti i file gestiti da CFS andranno persi e dovrai ripopolare CFS con tali file reimportando i certificati e le immagini personalizzate e apportando eventuali modifiche alla configurazione correlate. per un elenco dei file gestiti da CFS, consulta Servizio file client di Tableau Server.

  8. Se il nodo iniziale stava eseguendo il servizio di messaggistica, aggiungi il servizio di messaggistica a questo nodo:

    tsm topology set-process -pr activemqserver -n node2 -c 1

  9. (Facoltativo) Puoi anche aggiungere altri processi che erano in esecuzione sul nodo iniziale ma non su questo nodo. Ad esempio, per aggiungere un server cache:

    tsm topology set-process -pr cacheserver -n node2 -c 1

  10. Applica le modifiche:

    tsm pending-changes apply --ignore-node-status <nodeID>

    Se le modifiche in sospeso richiedono il riavvio del server, il comando pending-changes apply visualizzerà un messaggio per segnalare che verrà eseguito un riavvio. Questo messaggio viene visualizzato anche se il server è stato arrestato, ma in questo caso il riavvio non viene eseguito. Puoi eliminare la richiesta usando l’opzione --ignore-prompt, ma questo non modifica il comportamento del riavvio. Se le modifiche non richiedono un riavvio, vengono applicate senza visualizzare alcun messaggio. Per maggiori informazioni, consulta tsm pending-changes apply.

  11. Riavvia il controller di amministrazione TSM (come account di sistema tableau):

    sudo su -l tableau -c "systemctl --user restart tabadmincontroller_0.service"

    Nota: il riavvio di tabadmincontroller potrebbe richiedere alcuni minuti. Se tenti di applicare le modifiche in sospeso nel passaggio successivo prima che il controller si sia completamente riavviato, TSM non potrà connettersi al controller. Puoi verificare che il controller sia in esecuzione utilizzando il comando tsm status -v. Il controller di amministrazione di Tableau Server deve essere elencato come "in esecuzione".

  12. Applica le modifiche in sospeso (è possibile che non ve ne siano, ma questo passaggio è obbligatorio):

    tsm pending-changes apply --ignore-node-status <nodeID>

  13. Attiva la licenza di Tableau Server sul nuovo nodo del controller:

    tsm licenses activate -k <product-key>

  14. Verifica che la licenza sia attivata correttamente:

    tsm licenses list

  15. Se il nodo iniziale stava eseguendo il servizio di coordinamento, devi implementare un nuovo insieme dei servizi di coordinamento che non includa tale nodo. Se hai un cluster a tre nodi e il nodo iniziale stava eseguendo il servizio di coordinamento, devi implementare un nuovo insieme dei servizi di coordinamento a istanza singola in un nodo diverso e cancellare l’insieme precedente. In questo esempio viene implementata un’istanza singola del servizio di coordinamento sul secondo nodo:

    tsm topology deploy-coordination-service -n node2 --ignore-node-status node1

  16. Se il nodo iniziale eseguiva un’istanza di archivio file, è necessario rimuovere tale istanza:

    tsm topology filestore decommission -n <nodeID> --delete-filestore

    Dove nodeID è il nodo iniziale che ha avuto esito negativo.

  17. Applica le modifiche in sospeso utilizzando il flag --ignore-warnings se il nuovo insieme dei servizi di coordinamento distribuito in precedenza è un insieme di nodi singoli:

    tsm pending-changes apply --ignore-node-status node1 --ignore-warnings

  18. Rimuovi il nodo iniziale, dove nodeID è il nodo iniziale con esito negativo:

    tsm topology remove-nodes -n <nodeID>

  19. Applica le modifiche in sospeso utilizzando il flag --ignore-warnings se il nuovo insieme dei servizi di coordinamento distribuito in precedenza è un insieme di nodi singoli:

    tsm pending-changes apply --ignore-warnings

  20. Avvia Tableau Server:

    tsm start

    A questo punto il server dovrebbe avviarsi e potrai utilizzare TSM per configurarlo. Il passaggio successivo consiste nel sostituire il nodo iniziale in modo che il cluster disponga del numero di nodi originale. Questa operazione dipende dal fatto che desideri riutilizzare o meno il nodo che ha avuto esito negativo. Consigliamo di riutilizzare il nodo solo se riesci a identificare il motivo per cui ha avuto esito negativo, per poi intraprendere le operazioni necessarie per impedire l’errore.

  21. Se prevedi di riutilizzare il nodo originale, dovrai innanzitutto rimuovere completamente Tableau da esso. A tale scopo, esegui lo script tableau-server-obliterate. Per maggiori informazioni su questa operazione, consulta Rimuovere Tableau Server dal computer.

  22. In un computer nuovo o nel computer originale dopo la rimozione completa di Tableau, installa Tableau utilizzando il programma di installazione originale e un file di bootstrap generato dal nodo che ora esegue il controller di amministrazione e il servizio di gestione licenze. Verrà creato un nodo aggiuntivo che puoi configurare come parte del tuo cluster. Per maggiori informazioni su come aggiungere il nodo, consulta Installare e configurare nodi aggiuntivi.

    È consigliabile configurare qualsiasi processo perso quando il nodo originale ha avuto esito negativo, per verificare che il cluster sia completamente ridondante. Puoi spostare i processi dal nuovo nodo iniziale a quello aggiuntivo appena inserito, in modo da duplicare la configurazione originale. Ad esempio, se il nodo iniziale eseguiva solo gateway e archivio file, potrebbe essere necessario configurare il nuovo nodo iniziale in modo analogo.

  23. Una volta che i tuoi nodi sono attivi e funzionanti come desideri, ti consigliamo anche di ridistribuire un nuovo insieme di servizi di coordinamento. Per maggiori informazioni, consulta Implementare un insieme dei servizi di coordinamento.

  24. Infine, se non l’hai già fatto, aggiungi un’istanza di CFS a ogni nodo che esegue il servizio di coordinamento. Per maggiori informazioni, consulta Configurare servizio file del client

    In un cluster, se si verifica un problema in un nodo che esegue l’unica istanza di CFS, tutti i file gestiti da CFS andranno persi e dovrai ripopolare CFS con tali file reimportando i certificati e le immagini personalizzate e apportando eventuali modifiche alla configurazione correlate.Per un elenco dei file gestiti da CFS, consulta Servizio file client di Tableau Server.

 

Grazie per il tuo feedback.Il tuo feedback è stato inviato. Grazie!