Incidentes de hardware
Hardware Os incidentes monitoram o próprio servidor. Eles podem ser usados para ajudar a identificar problemas do servidor que podem afetar o desempenho do Tableau Server.
Você pode definir limites para os seguintes problemas:
- Utilização da CPU
- Memória disponível
- Uso de memória
- Espaço em disco livre
Os seguintes incidentes são configurados por padrão quando você instala um novo Resource Monitoring Tool do Tableau:
- Quando o espaço em disco disponível fica abaixo de 10 GB por 10 minutos ou mais, um incidente de aviso é registrado e, quando o disco disponível fica abaixo de 5 GB por 10 minutos ou mais, um incidente crítico é registrado.
- Quando a memória disponível fica abaixo de 8 GB por mais de 10 minutos, um incidente de aviso é registrado.
- Quando a utilização da CPU em todo o servidor é de 80% ou mais por 5 minutos, um incidente de aviso é registrado.
Nota: os incidentes relacionados à memória são configurados em múltiplos binários de bytes.
Configure limites usando a interface na Web do Servidor RMT ou atualizando o arquivo de configuração config.json
.
Para definir os limites para incidentes de hardware, no menu Admin, selecione Configuração e acesse a guia Incidentes.
Para Utilização da CPU, defina o seguinte:
Para definir os limites para incidentes de hardware, no menu Admin, selecione Configuração e acesse a guia Incidentes.
Chave | Obrigatório? | Descrição |
---|---|---|
Gravidade | Obrigatório | Consulte Nível de severidade do incidente. |
Processo | Obrigatório | O limite se aplica a todo o Tableau Server ou a um único processo conforme especificado. |
Limite inicial | Obrigatório | A utilização da CPU deve exceder o valor especificado antes que um incidente seja criado e monitorado. Defina a porcentagem e a duração desse limite. |
Limite final | Opcional | A utilização da CPU deve ficar abaixo do valor especificado antes que um incidente seja considerado resolvido. |
Para memória disponível, defina o seguinte:
Chave | Obrigatório? | Descrição |
---|---|---|
Gravidade | Obrigatório | Consulte Nível de severidade do incidente. |
Limite inicial | Obrigatório | A memória disponível deve ficar abaixo do valor especificado antes que um incidente seja criado e monitorado. Defina a porcentagem e a duração desse limite. |
Limite final | Opcional | A memória disponível deve ficar acima do valor especificado antes que um incidente seja considerado resolvido. |
Para Utilização da memória, defina o seguinte:
Chave | Obrigatório? | Descrição |
---|---|---|
Gravidade | Obrigatório | Consulte Nível de severidade do incidente. |
Processo | Obrigatório | O limite se aplica a todo o Tableau Server ou a um único processo conforme especificado. |
Limite inicial | Obrigatório | A utilização da memória deve ser igual ao valor especificado antes que um incidente seja criado e monitorado. Defina a porcentagem e a duração desse limite. |
Limite final | Opcional | A utilização da memória deve ficar abaixo do valor especificado antes que um incidente seja considerado resolvido. |
Para espaço em disco livre, defina o seguinte:
Chave | Obrigatório? | Descrição |
---|---|---|
Gravidade | Obrigatório | Consulte Nível de severidade do incidente. |
Limite inicial | Obrigatório | O espaço em disco livre deve ficar abaixo do valor especificado antes que um incidente seja criado e monitorado. Defina a porcentagem e a duração desse limite. |
Limite final | Opcional | O espaço em disco livre deve ficar acima do valor especificado antes que um incidente seja considerado resolvido. |
Para Tamanho da fila em disco, defina o seguinte:
Chave | Obrigatório? | Descrição |
---|---|---|
Gravidade | Obrigatório | Consulte Nível de severidade do incidente. |
Limite inicial | Obrigatório | O tamanho da fila em disco deve ser igual ao valor especificado antes que um incidente seja criado e monitorado. Defina a porcentagem e a duração desse limite. |
Limite final | Opcional | O tamanho da fila em disco deve ficar abaixo do valor especificado antes que um incidente seja considerado resolvido. |
Um trecho do exemplo de config.json
definindo dois incidentes de hardware:
{
"monitoring": {
"incidents": {
"triggers": [
{
"counter": "DiskSpaceAvailableKB",
"severity": "warning",
"threshold": 1048576
},
{
"counter": "ProcessorTimePercent",
"severity": "warning",
"threshold": 0.95,
"thresholdDuration": 300000,
"endThreshold": 0.90,
"endThresholdDuration": 5000
}
]
}
}
}
- O incidente DiskSpaceAvailableKB acionará um aviso quando o espaço em disco disponível ficar abaixo de 10 GB.
- O incidente ProcessorTimePercent acionará um aviso assim que a CPU tiver pelo menos 95% de utilização por mais de 5 minutos. O incidente será considerado resolvido após a utilização da CPU abaixo, de 90% para 5 segundos.
As configurações padrão podem ou não atender aos requisitos, e podem ser alteradas com base no seu ambiente. Como exemplo, para um ambiente, cujo identificador era “staging-environment”, acionar um aviso quando o espaço em disco disponível ficar abaixo de 2 GB, a configuração teria a seguinte aparência:
{
"environments": {
"staging-environment": {
"monitoring": {
"incidents": {
"triggers": [
{
"counter": "DiskSpaceAvailableKB",
"severity": "warning",
"threshold": 2097152
}
]
}
}
}
}
}
Chave | Tipo de dados | Obrigatório? | Descrição |
---|---|---|---|
counter | Cadeia de caracteres | Obrigatório | O identificador do incidente de hardware a ser monitorado. As opções disponíveis são:
|
severity | Cadeia de caracteres | Opcional | Consulte Nível de severidade do incidente. Valor padrão: |
threshold | Número | Obrigatório | O limite que deve ser excedido antes que um incidente seja monitorado. |
thresholdDuration | Número | Opcional | A quantidade de tempo em milissegundos para monitorar a situação antes de acionar um incidente. Se não especificado, um incidente será acionado assim que o threshold for alcançado. |
endThreshold | Número | Opcional | O limite que deve ser excedido antes que um incidente seja considerado resolvido. |
endThresholdDuration | Número | Opcional | A quantidade de tempo em milissegundos para monitorar a situação antes de concluir um incidente. Se não especificado, um incidente será resolvido assim que o endThreshold for alcançado. Se endThreshold não estiver definido, threshold será usado. |
Quem pode fazer isso
O administrador do Resource Monitoring Tool ou um usuário do Resource Monitoring Tool com função Gerente de servidor/ambiente.