Récupérer suite à la défaillance d’un nœud

Si vous rencontrez un problème avec l’un de vos nœuds de serveur et que vous avez des processus redondants sur vos autres nœuds, Tableau Server peut continuer à fonctionner. Vos utilisateurs peuvent continuer à se connecter et à voir et utiliser leur contenu après la défaillance du nœud, mais ils risquent de constater une dégradation des performances suite à la défaillance du nœud. De plus, votre serveur sera davantage exposé à un risque de panne catastrophique si le nœud défaillant exécute des processus qui ne sont plus redondants. Cela signifie que vous devez veiller à supprimer le nœud défaillant et le remplacer dès que possible. Si votre nœud est défaillant pour des raisons qui permettent une récupération dans un délai relativement bref (par exemple une panne matérielle que vous pouvez corriger), vous devriez d’abord tenter de rétablir le nœud sans utiliser la procédure ci-dessous.

Nœud : Si le nœud défaillant est votre nœud initial, les implications sont plus importantes pour vos installations Tableau Server. Pour savoir comment récupérer suite à la défaillance d’un nœud initial, consultez Récupérer suite à la défaillance d’un nœud initial.

Configuration générale requise

La version 2020.1 de Tableau Server a été mise à jour avec une fonctionnalité de récupération améliorée. La procédure correspondante a été écrite pour Tableau Server 2020.1.

Si vous essayez de récupérer un nœud défectueux depuis une version antérieure de Tableau Server, vous devez appliquer la procédure adaptée à cette version. Pour consulter les versions archivées de l’aide de Tableau, consultez Aide de Tableau(Le lien s’ouvre dans une nouvelle fenêtre).

  • Il y a au moins un nœud opérationnel contenant une instance du stockage de fichiers.
  • Il y a au moins un nœud opérationnel contenant un référentiel.
  • Il y a au moins un nœud opérationnel contenant le service des fichiers client (CFS).

Remarque : cette opération inclut des étapes que vous devrez peut-être effectuer avec la ligne de commande TSM.

Suppression d’un nœud défaillant

Pour supprimer un nœud défaillant de votre groupement Tableau Server :

  1. Identifiez le nœud défaillant :

    tsm status -v

    Le nœud défaillant affichera le statut « ERREUR » et les processus s’afficheront comme étant indisponibles. L’ID du nœud est répertorié comme « node<n> », suivi du nom de la machine, par exemple:node3

    node3: WIN-OO915SFASVH
    						Status: ERROR
    					'Tableau Server Gateway 0' status is unavailable.
  2. Arrêtez Tableau Server.

    Le reste de cette procédure comprend quelques commandes avec l’option --ignore-node-status. Une commande exécutée avec l’option --ignore-node-status est exécutée sans tenir compte de l’état du nœud spécifié. Pour utiliser --ignore-node-status, spécifiez le nœud défaillant :

    tsm stop --ignore-node-status <nodeID>

    Par exemple, si le nœud 3 a échoué, exécutez la commande comme suit :

    tsm stop --ignore-node-status node3
  3. Déterminez tous les processus clés qui étaient en cours d’exécution sur le nœud :

    • Si le nœud défaillant exécutait le service de messagerie, vous devez supprimer le service du nœud défaillant et l’ajouter à un nouveau nœud.

      Supprimez-le du nœud défaillant :

      tsm topology set-process -pr activemqserver -n <nodeID> -c 0
      

      Ajoutez-le à un nœud actif :

      tsm topology set-process -pr activemqserver -n <nodeID> -c 1
    • Si le nœud défaillant exécutait le service de coordination, vous devez déployer un nouvel ensemble avant de pouvoir supprimer le nœud :

      tsm topology deploy-coordination-service -n <good_nodeID> --ignore-node-status <failed_nodeID>
      
    • Si le nœud défaillant exécutait la seule instance de CFS (Service des fichiers client), vous devez configurer une nouvelle instance de CFS sur un nœud opérationnel. Nous vous recommandons de configurer CFS sur chaque nœud exécutant le service de coordination. Pour des étapes détaillées, consultez Configurer le service des fichiers client (CFS).

    • Si le nœud défaillant exécutait le stockage de fichiers, vous devez forcer la désactivation du stockage de fichiers et le supprimer avant de pouvoir supprimer le nœud.

      tsm topology filestore decommission -n <nodeID> --delete-filestore

      Appliquez les modifications en attente (utilisez l’option --ignore-warnings si vous aviez un groupement à trois nœuds et une seule instance de service de coordination) :

      tsm pending-changes apply --ignore-warnings --ignore-node-status <nodeID>
  4. Si le groupement était un groupement à trois nœuds et qu’il existe des référentiels sur les nœuds worker restants, vous devez soit supprimer un référentiel, soit ajouter un nouveau nœud. Vous êtes en effet limité à une seule instance du référentiel lorsque vous avez moins de trois nœuds.

    Pour supprimer un référentiel :

    tsm topology set-process -n <nodeID> -pr pgsql -c 0
  5. Exécutez la commande pour supprimer le nœud défaillant. Cette commande ajoute la modification à la liste des modifications en attente :

    tsm topology remove-nodes -n <nodeID>
  6. Vérifiez que la suppression du nœud est en attente :

    tsm pending-changes list
  7. Appliquez les modifications en attente pour supprimer le nœud :

    tsm pending-changes apply 
  8. Démarrez Tableau Server :

    tsm start
  9. Installez Tableau Server sur un nouveau nœud et configurez le nœud avec les processus que l’ancien nœud défaillant était en train d’exécuter.

  10. Sur un nouvel ordinateur, ou sur votre ordinateur d’origine dont vous avez complètement supprimé Tableau, installez Tableau à l’aide de votre programme d’installation d’origine et un fichier bootstrap généré depuis le nœud initial. Pour savoir comment procéder, consultez Installer et configurer des nœuds supplémentaires.

    Une meilleure pratique consiste à configurer les processus que vous avez perdus lors de la défaillance du nœud d’origine, afin d’assurer la redondance de votre groupement.

  11. Vous devriez également redéployer un nouvel ensemble de service de coordination une fois que vos nœuds seront opérationnels et s’exécuteront comme souhaité. Pour plus d’informations, consultez Déployer un ensemble de service de coordination.

  12. Enfin, si vous ne l’avez pas déjà fait, ajoutez une instance de CFS à chaque nœud qui exécute le service de coordination. Pour plus d’informations, consultez Configurer le service des fichiers client (CFS)