Récupérer suite à la défaillance d’un nœud initial

Le premier ordinateur sur lequel vous installez Tableau, le « nœud initial », présente certaines caractéristiques uniques. Trois processus s’exécutent uniquement sur le nœud initial et ne peuvent pas être déplacés vers un autre nœud, sauf en situation d’échec : le service de licences (Gestionnaire de licences), le service d’activation et le contrôleur TSM (contrôleur d’administration). Tableau Server inclut un script qui automatise le déplacement de ces processus vers l’un de vos autres nœuds existants afin que vous puissiez accéder à nouveau complètement à TSM et continuer à exécuter Tableau Server.

Deux autres processus sont inclus au départ sur le nœud initial, mais peuvent être ajoutés ou déplacés vers des nœuds supplémentaires, CFS (service des fichiers client) et le service de coordination. Selon la façon dont votre installation a été configurée avec CFS et le Service de coordination, vous devrez peut-être également prendre des mesures pour les redéployer.

En cas d’échec d’un nœud initial

Si vous rencontrez un problème avec le nœud initial et que des processus redondants s’exécutent sur vos autres nœuds, il n’y a aucune garantie que Tableau Server continuera à fonctionner.

Tableau Server peut continuer à s’exécuter jusqu’à 72 heures suivant la défaillance d’un nœud initial, avant que l’absence du service de licence n’affecte d’autres processus. Si tel est le cas, vos utilisateurs peuvent continuer à se connecter et également voir et utiliser leur contenu après la défaillance du nœud initial. Par contre, vous ne pourrez pas reconfigurer Tableau Server parce que vous n’aurez pas accès au contrôleur d’administration.
Si vous exécutez une version de Tableau Server 2021.4.2 (ou antérieure) configurée pour ATR, des problèmes avec le nœud initial rendront toutes les fonctionnalités du serveur indisponibles. Ceci est vrai, que le nœud ait un problème ou que vous l’arrêtiez intentionnellement (par instance pour appliquer un correctif au niveau du système).

Même lorsqu’il est configuré avec des processus redondants, il est possible que Tableau Server cesse de fonctionner après l’échec du nœud initial. Ceci s’applique même lorsqu’une installation est configurée pour la haute disponibilité. Vous devriez donc vous efforcer de déplacer les deux processus uniques vers un autre de vos nœuds actifs dès que possible. Si votre nœud initial est défaillant pour des raisons qui permettent une récupération dans un délai relativement bref (par exemple une panne matérielle que vous pouvez corriger), vous devriez d’abord tenter de rétablir le nœud sans utiliser la procédure ci-dessous.

Remarque : les étapes de cet article nécessitent un arrêt du serveur et peuvent entraîner des interruptions. Elles ne doivent être appliquées qu’en cas de défaillance catastrophique du nœud initial. Si vous ne pouvez pas rétablir votre nœud initial, utilisez les étapes suivantes pour déplacer les processus TSM vers un autre nœud dans votre cluster.

Configuration générale requise

La version 2021.1 de Tableau Server a été mise à jour avec une fonctionnalité de récupération améliorée. La procédure décrite dans cette rubrique a été écrite pour Tableau Server 2021.1.

Si vous essayez de récupérer un nœud défectueux depuis une version antérieure de Tableau Server, vous devez appliquer la procédure pour cette version. Pour consulter les versions archivées de l’aide de Tableau, voir l’Aide de Tableau(Le lien s’ouvre dans une nouvelle fenêtre).

Dans le cadre du processus de configuration d’une installation multinœud de Tableau Server , il est conseillé d’avoir déployé un ensemble de service de coordination. Le processus ci-dessous part de l’hypothèse qu’un ensemble de service de coordination était déployé avant qu’un problème ne survienne avec le nœud initial. Pour plus d’informations sur le déploiement d’un ensemble de service de coordination, consultez Déployer un ensemble de service de coordination.
Ce processus suppose que vous avez configuré des instances du service des fichiers client (CFS) sur chaque nœud exécutant le service de coordination. Si vous n’avez pas ajouté d’instances supplémentaires de CFS, votre seule instance se trouvait sur le nœud initial et vous devrez ajouter au moins une instance de CFS à un autre nœud. Vous devrez également remplir à nouveau CFS. Tableau Server a besoin d’au moins une instance de CFS. Pour plus d’informations, consultez Configurer le service des fichiers client (CFS) et le Service des fichiers client Tableau Server.

Remarque : cette opération inclut des étapes que vous devrez peut-être effectuer avec la ligne de commande TSM. Pour utiliser l’interface en ligne de commande TSM, vous avez besoin d’un accès administrateur sur l’un des nœuds de votre installation et d’informations d’identification administrateur TSM pour exécuter des commandes TSM.

Déplacer le contrôleur TSM, le service de licence et le service d’activation vers un autre nœud

En cas de problème avec le nœud initial, le contrôleur TSM, le service de licence et le service d’activation doivent être redémarrés sur un autre nœud. Suivez ces étapes pour utiliser le script move-tsm-controller fourni et faire en sorte que le contrôleur TSM, le service de licence et le service d’activation fonctionnent sur un autre nœud.

Sur un nœud encore opérationnel, exécutez le script de récupération du contrôleur. Pour cela, ouvrez une invite de commande, accédez au répertoire de scripts de Tableau Server (Par défaut :C:\Program Files\Tableau\Tableau Server\packages\scripts.<version_code>\) et tapez la commande suivante :
move-tsm-controller -n <nodeID>
où « nodeID » est l’ID du nœud sur lequel vous souhaitez que le contrôleur TSM s’exécute. Par exemple :
move-tsm-controller -n node2
Fermez et rouvrez la commande, puis vérifiez que le contrôleur d’administration s’exécute sur le nœud en entrant cette commande :
tsm status -v
Arrêtez Tableau Server.
Le reste de cette procédure comprend quelques commandes avec l’option --ignore-node-status. Une commande exécutée avec l’option --ignore-node-status sera exécutée sans tenir compte de l’état du nœud spécifié. Pour utiliser --ignore-node-status, spécifiez le nœud défaillant :
tsm stop --ignore-node-status <nodeID>
Par exemple, si le nœud 1 a échoué, exécutez la commande comme suit :
tsm stop --ignore-node-status node1
Ajoutez le service de licence au nœud :
tsm topology set-process -pr licenseservice -n <nodeID> -c 1
Supprimez l’ancien service de licence du nœud d’origine, où « nodeID » est le nœud initial défaillant :
tsm topology set-process -pr licenseservice -n <nodeID> -c 0
Si vous utilisez l’une des versions suivantes
- 2023.3.0 ou version ultérieure
- 2023.1.3 ou version ultérieure
- 2022.3.7 ou version ultérieure
- 2022.1.15 ou version ultérieure
ou si vous exécutez une version antérieure et utilisez ATR, ajoutez le service d’activation au nouveau nœud :
tsm topology set-process -pr activationservice -n <nodeID> -c 1
Si vous utilisez l’une de ces versions ou une version ultérieure
- 2023.3.0 ou version ultérieure
- 2023.1.3 ou version ultérieure
- 2022.3.7 ou version ultérieure
- 2022.1.15 ou version ultérieure
ou si vous utilisez une version antérieure et utilisez ATR, supprimez l’ancien service de activation du nœud d’origine, où « nodeID » est le nœud initial défaillant :
tsm topology set-process -pr activationservice -n <nodeID> -c 0
Important : Dans un cluster, en cas de défaillance du nœud qui exécute votre seule instance CFS, tous les fichiers gérés par CFS seront perdus et vous devrez remplir à nouveau ces fichiers en réimportant les certificats et les images personnalisées, et en apportant les modifications de configuration associées. Pour une liste des fichiers gérés par CFS, consultez Service des fichiers client Tableau Server.
Si le nœud initial exécutait la du service de messagerie, ajoutez le Service de messagerie à ce nœud :
tsm topology set-process -pr activemqserver -n node2 -c 1
(Facultatif) Vous pouvez également ajouter d’autres processus qui fonctionnaient sur le nœud initial, mais pas sur ce nœud. Par exemple, pour ajouter un serveur de cache :
tsm topology set-process -pr cacheserver -n node2 -c 1
Appliquez les modifications :
tsm pending-changes apply --ignore-node-status <nodeID>
Si les modifications en attente nécessitent un redémarrage du serveur, la commande pending-changes apply affichera une invite pour vous informer qu’un redémarrage va avoir lieu. Cette invite s’affiche même si le serveur est arrêté, mais dans ce cas, il n’y a pas de redémarrage. Vous pouvez supprimer l’invite à l’aide de l’option --ignore-prompt, mais cela ne modifiera pas le comportement de redémarrage. Si les modifications ne nécessitent pas de redémarrage, les modifications sont appliquées sans invite. Pour plus d’informations, consultez tsm pending-changes apply.
Redémarrez le contrôleur d’administration TSM :
net stop tabadmincontroller_0
net start tabadmincontroller_0
Remarque : vous devez exécuter ces commandes en tant qu’administrateur depuis une invite de commande. Selon la configuration de votre ordinateur, vous devrez peut-être les exécuter dans le dossier C:\Windows\System32.
Remarque : le redémarrage de tabadmincontroller peut demander quelques minutes. Si vous tentez d’appliquer les modifications en attente à l’étape suivante avant que le contrôleur ait entièrement redémarré, TSM ne pourra pas se connecter au contrôleur. Vous pouvez vérifier que le contrôleur est en cours d’exécution en utilisant la commande tsm status -v. Le contrôleur d’administration de Tableau Server devrait afficher l’état « en cours d’exécution ».
Appliquez les modifications en attente (il se peut qu’il n’y en ait aucune en apparence, mais cette étape est requise) :
tsm pending-changes apply --ignore-node-status <nodeID>
Activez la licence Tableau Server sur le nouveau nœud du contrôleur :
tsm licenses activate -k <product-key>
Vérifiez que la licence est correctement activée :
tsm licenses list
Si le nœud initial exécutait le service de coordination, vous devez un nouvel ensemble de service de coordination qui n’inclut pas ce nœud. Si vous avez un cluster à trois nœuds et que le nœud initial exécutait le service de coordination, vous devez déployer un nouvel ensemble de service de coordination à une seule instance sur un nœud différent, et nettoyer l’ancien ensemble. Dans cet exemple, une seule instance du service de coordination est déployée sur le second nœud :
tsm topology deploy-coordination-service -n node2 --ignore-node-status node1
Si le nœud initial exécutait une instance du répertoire de fichiers, vous devez supprimer cette instance :
tsm topology filestore decommission -n <nodeID> --delete-filestore
Où nodeID est le nœud initial qui a échoué.
Appliquez les modifications en attente à l’aide de l’indicateur --ignore-warnings si le nouvel ensemble de service de coordination que vous avez déployé ci-dessus est un ensemble à un seul nœud :
tsm pending-changes apply --ignore-node-status node1 --ignore-warnings
Supprimez le nœud initial, où nodeID est le nœud initial défaillant :
tsm topology remove-nodes -n <nodeID>
Appliquez les modifications en attente à l’aide de l’indicateur --ignore-warnings si le nouvel ensemble de service de coordination que vous avez déployé ci-dessus est un ensemble à un seul nœud :
tsm pending-changes apply --ignore-warnings
Démarrez Tableau Server :
tsm start
À ce stade, votre serveur devrait démarrer, et vous devriez pouvoir utiliser TSM pour le configurer. L’étape suivante consiste à remplacer votre nœud initial afin que votre cluster ait le nombre de nœuds d’origine. La manière dont vous procédez varie selon que vous souhaitez ou non réutiliser le nœud défaillant. Nous vous recommandons de ne réutiliser ce nœud que si vous pouvez identifier la raison de sa défaillance, et prendre des mesures pour empêche qu’elle se reproduise.
Si vous comptez réutiliser le nœud d’origine, vous devez d’abord supprimer complètement Tableau de ce nœud. Faites-le en exécutant le script tableau-server-obliterate. Pour savoir comment procéder, consultez Supprimer Tableau Server de votre ordinateur.
Sur un nouvel ordinateur, ou sur votre ordinateur d’origine dont vous avez complètement supprimé Tableau, installez Tableau en utilisant votre programme d’installation d’origine et un fichier bootstrap généré depuis le nœud qui exécute maintenant le contrôleur d’administration et le service de licence. Ceci crée un nœud supplémentaire que vous pouvez configurer dans le cadre de votre cluster. Pour savoir comment ajouter le nœud, consultez Installer et configurer des nœuds supplémentaires.
Une meilleure pratique consiste à configurer les processus que vous avez perdus lors de la défaillance du nœud d’origine, afin d’assurer la redondance de votre cluster. Vous pouvez souhaiter déplacer les processus depuis votre nouveau nœud initial vers le nœud supplémentaire récemment ajouté pour dupliquer votre configuration d’origine. Par exemple, si votre nœud initial exécutait uniquement la passerelle et le répertoire de fichiers, vous souhaiterez peut-être configurer le nouveau nœud initial de la même manière.
Vous devriez également redéployer un nouvel ensemble de service de coordination une fois que vos nœuds seront opérationnels et s’exécuteront comme souhaité. Pour plus d’informations, consultez Déployer un ensemble de service de coordination.
Enfin, si vous ne l’avez pas déjà fait, ajoutez une instance de CFS à chaque nœud qui exécute le service de coordination. Pour plus d’informations, consultez Configurer le service des fichiers client (CFS)
Dans un cluster, en cas de défaillance du nœud qui exécute votre seule instance CFS, tous les fichiers gérés par CFS seront perdus et vous devrez remplir à nouveau ces fichiers en réimportant les certificats et les images personnalisées, et en apportant les modifications de configuration associées.Pour une liste des fichiers gérés par CFS, consultez Service des fichiers client Tableau Server.

Retour en haut

Aide de Tableau Server sur Windows