Incidents matériels

Hardware Les incidents matériels surveillent le serveur lui-même. Ils peuvent servir à identifier les problèmes de serveur susceptibles d'affecter les performances de Tableau Server.

Vous pouvez fixer des seuils pour les questions suivantes :

  • Utilisation du processeur
  • Mémoire disponible
  • Utilisation de la mémoire
  • Espace disque disponible

Les incidents suivants sont configurés par défaut lorsque vous installez un nouveau Tableau Resource Monitoring Tool :

  • Lorsque l'espace disque disponible devient inférieur à 10 Go pendant 10 minutes ou plus, un incident d'avertissement est enregistré, et lorsque l'espace disque disponible devient inférieur à 5 Go pendant 10 minutes ou plus, un incident critique est enregistré.
  • Lorsque la mémoire disponible devient inférieure à 8 Go pendant plus de 10 minutes, un incident d'avertissement est enregistré.
  • Lorsque l'utilisation du processeur pour l'ensemble du serveur est de 80 % ou plus pendant 5 minutes, un incident d'avertissement est enregistré.

Remarque : les incidents liés à la mémoire sont configurés en multiples binaires d'octets.

Vous pouvez configurer les seuils en utilisant l'interface Web du serveur RMT ou en mettant à jour le fichier de configuration config.json.

Pour définir les seuils d'incidents matériels, dans le menu Administrateur, sélectionnez Configuration, et allez à l'onglet Incidents.

Dans Utilisation du processeur, définissez les paramètres suivants :

Pour définir les seuils d'incidents matériels, dans le menu Administrateur, sélectionnez Configuration, et allez à l'onglet Incidents.

CléObligatoire ?Description
GravitéObligatoire

Voir Niveau de gravité de l'incident.

ProcessusObligatoireLe seuil s'applique à l'ensemble de Tableau Server ou à un seul processus, comme indiqué.
Seuil de départObligatoireL'utilisation de l'unité centrale doit dépasser la valeur spécifiée avant qu'un incident ne soit créé et surveillé. Fixez le pourcentage et la durée de ce seuil.
Seuil de finFacultatifL'utilisation du processeur qui doit être inférieure à la valeur spécifiée avant qu'un incident soit considéré comme résolu.

Pour la Mémoire disponible, réglez ce qui suit :

CléObligatoire ?Description
GravitéObligatoire

Voir Niveau de gravité de l'incident.

Seuil de départObligatoireLa mémoire disponible doit être inférieure à la valeur spécifiée pour qu'un incident soit créé et surveillé. Fixez le pourcentage et la durée de ce seuil.
Seuil de finFacultatifLa mémoire disponible doit être supérieure à la valeur spécifiée pour qu'un incident soit considéré comme résolu.

Dans Utilisation de la mémoire, définissez ce qui suit :

CléObligatoire ?Description
GravitéObligatoire

Voir Niveau de gravité de l'incident.

ProcessusObligatoireLe seuil s'applique à l'ensemble de Tableau Server ou à un seul processus, comme indiqué.
Seuil de départObligatoireL'utilisation de la mémoire doit être égale à la valeur spécifiée pour qu'un incident soit créé et surveillé. Fixez le pourcentage et la durée de ce seuil.
Seuil de finFacultatifL'utilisation de la mémoire doit être inférieure à la valeur spécifiée pour qu'un incident soit considéré comme résolu.

Dans Espace disque disponible, définissez ce qui suit :

CléObligatoire ?Description
GravitéObligatoire

Voir Niveau de gravité de l'incident.

Seuil de départObligatoireL'espace disque disponible doit être inférieur à la valeur spécifiée pour qu'un incident soit créé et surveillé. Fixez le pourcentage et la durée de ce seuil.
Seuil de finFacultatifL'espace disque libre doit être supérieur à la valeur spécifiée pour qu'un incident soit considéré comme résolu.

Dans Longueur de file d'attente du disque, définissez ce qui suit :

CléObligatoire ?Description
GravitéObligatoire

Voir Niveau de gravité de l'incident.

Seuil de départObligatoireLa longueur de file d'attente du disque doit être égale à la valeur spécifiée pour qu'un incident soit créé et surveillé. Fixez le pourcentage et la durée de ce seuil.
Seuil de finFacultatifLa longueur de file d'attente du disque doit être inférieure à la valeur spécifiée pour qu'un incident soit considéré comme résolu.

Snippet d'exemple config.json définissant deux incidents matériels :

{  
 "monitoring":  {  
    "incidents":  {  
      "triggers":  [  
        {  
          "counter":  "DiskSpaceAvailableKB",  
          "severity":  "warning",  
          "threshold":  1048576  
        },  
        {  
          "counter":  "ProcessorTimePercent",  
          "severity":  "warning",  
          "threshold":  0.95,  
          "thresholdDuration":  300000,  
          "endThreshold":  0.90,  
          "endThresholdDuration":  5000  
        }  
      ]  
    }  
  }  
}
  • L'incident DiskSpaceAvailableKB déclenche un avertissement lorsque l'espace disque disponible devient inférieur à 10 Go.
  • L'incident ProcessorTimePercent déclenche un avertissement dès que le processeur a été utilisé au moins à 95 % pendant plus de 5 minutes. L'incident sera considéré comme résolu dès que le processeur aura été utilisé à moins de 90 % pendant 5 secondes.

Les paramètres par défaut peuvent ou non répondre à vos besoins et peuvent être modifiés en fonction de votre environnement. Par exemple, pour un environnement dont l'identificateur était « staging-environnement » pour déclencher un avertissement lorsque l'espace disque disponible devient inférieur à 2 Go, la configuration serait la suivante :

{  
  "environments":  {  
    "staging-environment":  {  
     "monitoring":  {  
        "incidents":  {  
          "triggers":  [  
            {  
              "counter":  "DiskSpaceAvailableKB",  
              "severity":  "warning",  
              "threshold":  2097152  
            }  
          ]  
        }  
      }  
    }  
  }  
}
CléType de donnéesObligatoire ?Description
counterChaîneObligatoire

L'identificateur de l'incident matériel à surveiller. Options disponibles :

  • ProcessorTimePercent
  • DiskSpaceAvailableKB
  • DiskQueueTotalLength
  • MemoryAvailableKB
  • MemoryCommittedKB
severityChaîneFacultatif

Voir Niveau de gravité de l'incident. Valeur par défaut : Warning

thresholdNombreObligatoireSeuil à dépasser pour déclencher la surveillance d'un incident.
thresholdDurationNombreFacultatifTemps de surveillance de la situation en millisecondes avant de déclencher un incident. S'il n'est pas spécifié, un incident sera déclenché dès que le threshold sera atteint.
endThresholdNombreFacultatifSeuil qui doit être dépassé pour qu'un incident soit considéré comme résolu.
endThresholdDurationNombreFacultatifTemps de surveillance de la situation en millisecondes avant de terminer un incident. Si ce seuil n'est pas spécifié, un incident sera résolu dès que endThreshold sera atteint. Si endThreshold n'est pas défini, threshold est utilisé.

Qui peut le faire ?

Administrateur Resource Monitoring Tool ou utilisateur Resource Monitoring Tool ayant un rôle Gestion du serveur/de l'environnement.

Merci de vos commentaires !