Incidents matériels
Hardware Les incidents matériels surveillent le serveur lui-même. Ils peuvent servir à identifier les problèmes de serveur susceptibles d’affecter les performances de Tableau Server.
Vous pouvez fixer des seuils pour les questions suivantes :
- Utilisation du processeur
- Mémoire disponible
- Utilisation de la mémoire
- Espace disque disponible
Les incidents suivants sont configurés par défaut lorsque vous installez un nouveau Tableau Resource Monitoring Tool :
- Lorsque l’espace disque disponible devient inférieur à 10 Go pendant 10 minutes ou plus, un incident d’avertissement est enregistré, et lorsque l’espace disque disponible devient inférieur à 5 Go pendant 10 minutes ou plus, un incident critique est enregistré.
- Lorsque la mémoire disponible devient inférieure à 8 Go pendant plus de 10 minutes, un incident d’avertissement est enregistré.
- Lorsque l’utilisation du processeur pour l’ensemble du serveur est de 80 % ou plus pendant 5 minutes, un incident d’avertissement est enregistré.
Remarque : les incidents liés à la mémoire sont configurés en multiples binaires d’octets.
Vous pouvez configurer les seuils en utilisant l’interface Web du serveur RMT ou en mettant à jour le fichier de configuration config.json
.
Pour définir les seuils d’incidents matériels, dans le menu Administrateur, sélectionnez Configuration, et allez à l’onglet Incidents.
Dans Utilisation du processeur, définissez les paramètres suivants :
Pour définir les seuils d’incidents matériels, dans le menu Administrateur, sélectionnez Configuration, et allez à l’onglet Incidents.
Clé | Obligatoire ? | Description |
---|---|---|
Gravité | Obligatoire | |
Processus | Obligatoire | Le seuil s’applique à l’ensemble de Tableau Server ou à un seul processus, comme indiqué. |
Seuil de départ | Obligatoire | L’utilisation de l’unité centrale doit dépasser la valeur spécifiée avant qu’un incident ne soit créé et surveillé. Fixez le pourcentage et la durée de ce seuil. |
Seuil de fin | Facultatif | L’utilisation du processeur qui doit être inférieure à la valeur spécifiée avant qu’un incident soit considéré comme résolu. |
Pour la Mémoire disponible, réglez ce qui suit :
Clé | Obligatoire ? | Description |
---|---|---|
Gravité | Obligatoire | |
Seuil de départ | Obligatoire | La mémoire disponible doit être inférieure à la valeur spécifiée pour qu’un incident soit créé et surveillé. Fixez le pourcentage et la durée de ce seuil. |
Seuil de fin | Facultatif | La mémoire disponible doit être supérieure à la valeur spécifiée pour qu’un incident soit considéré comme résolu. |
Dans Utilisation de la mémoire, définissez ce qui suit :
Clé | Obligatoire ? | Description |
---|---|---|
Gravité | Obligatoire | |
Processus | Obligatoire | Le seuil s’applique à l’ensemble de Tableau Server ou à un seul processus, comme indiqué. |
Seuil de départ | Obligatoire | L’utilisation de la mémoire doit être égale à la valeur spécifiée pour qu’un incident soit créé et surveillé. Fixez le pourcentage et la durée de ce seuil. |
Seuil de fin | Facultatif | L’utilisation de la mémoire doit être inférieure à la valeur spécifiée pour qu’un incident soit considéré comme résolu. |
Dans Espace disque disponible, définissez ce qui suit :
Clé | Obligatoire ? | Description |
---|---|---|
Gravité | Obligatoire | |
Seuil de départ | Obligatoire | L’espace disque disponible doit être inférieur à la valeur spécifiée pour qu’un incident soit créé et surveillé. Fixez le pourcentage et la durée de ce seuil. |
Seuil de fin | Facultatif | L’espace disque libre doit être supérieur à la valeur spécifiée pour qu’un incident soit considéré comme résolu. |
Dans Longueur de file d’attente du disque, définissez ce qui suit :
Clé | Obligatoire ? | Description |
---|---|---|
Gravité | Obligatoire | |
Seuil de départ | Obligatoire | La longueur de file d’attente du disque doit être égale à la valeur spécifiée pour qu’un incident soit créé et surveillé. Fixez le pourcentage et la durée de ce seuil. |
Seuil de fin | Facultatif | La longueur de file d’attente du disque doit être inférieure à la valeur spécifiée pour qu’un incident soit considéré comme résolu. |
Snippet d’exemple config.json
définissant deux incidents matériels :
{
"monitoring": {
"incidents": {
"triggers": [
{
"counter": "DiskSpaceAvailableKB",
"severity": "warning",
"threshold": 1048576
},
{
"counter": "ProcessorTimePercent",
"severity": "warning",
"threshold": 0.95,
"thresholdDuration": 300000,
"endThreshold": 0.90,
"endThresholdDuration": 5000
}
]
}
}
}
- L’incident DiskSpaceAvailableKB déclenche un avertissement lorsque l’espace disque disponible devient inférieur à 10 Go.
- L’incident ProcessorTimePercent déclenche un avertissement dès que le processeur a été utilisé au moins à 95 % pendant plus de 5 minutes. L’incident sera considéré comme résolu dès que le processeur aura été utilisé à moins de 90 % pendant 5 secondes.
Les paramètres par défaut peuvent ou non répondre à vos besoins et peuvent être modifiés en fonction de votre environnement. Par exemple, pour un environnement dont l’identificateur était « staging-environnement » pour déclencher un avertissement lorsque l’espace disque disponible devient inférieur à 2 Go, la configuration serait la suivante :
{
"environments": {
"staging-environment": {
"monitoring": {
"incidents": {
"triggers": [
{
"counter": "DiskSpaceAvailableKB",
"severity": "warning",
"threshold": 2097152
}
]
}
}
}
}
}
Clé | Type de données | Obligatoire ? | Description |
---|---|---|---|
counter | Chaîne | Obligatoire | L’identificateur de l’incident matériel à surveiller. Options disponibles :
|
severity | Chaîne | Facultatif | Voir Niveau de gravité de l’incident. Valeur par défaut : |
threshold | Nombre | Obligatoire | Seuil à dépasser pour déclencher la surveillance d’un incident. |
thresholdDuration | Nombre | Facultatif | Temps de surveillance de la situation en millisecondes avant de déclencher un incident. S’il n’est pas spécifié, un incident sera déclenché dès que le threshold sera atteint. |
endThreshold | Nombre | Facultatif | Seuil qui doit être dépassé pour qu’un incident soit considéré comme résolu. |
endThresholdDuration | Nombre | Facultatif | Temps de surveillance de la situation en millisecondes avant de terminer un incident. Si ce seuil n’est pas spécifié, un incident sera résolu dès que endThreshold sera atteint. Si endThreshold n’est pas défini, threshold est utilisé. |
Qui peut le faire ?
Administrateur Resource Monitoring Tool ou utilisateur Resource Monitoring Tool ayant un rôle Gestion du serveur/de l’environnement.