Incidentes de hardware

Hardware Os incidentes monitoram o próprio servidor. Eles podem ser usados para ajudar a identificar problemas do servidor que podem afetar o desempenho do Tableau Server.

Você pode definir limites para os seguintes problemas:

  • Utilização da CPU
  • Memória disponível
  • Uso de memória
  • Espaço em disco livre

Os seguintes incidentes são configurados por padrão quando você instala um novo Resource Monitoring Tool do Tableau:

  • Quando o espaço em disco disponível fica abaixo de 10 GB por 10 minutos ou mais, um incidente de aviso é registrado e, quando o disco disponível fica abaixo de 5 GB por 10 minutos ou mais, um incidente crítico é registrado.
  • Quando a memória disponível fica abaixo de 8 GB por mais de 10 minutos, um incidente de aviso é registrado.
  • Quando a utilização da CPU em todo o servidor é de 80% ou mais por 5 minutos, um incidente de aviso é registrado.

Nota: os incidentes relacionados à memória são configurados em múltiplos binários de bytes.

Configure limites usando a interface na Web do Servidor RMT ou atualizando o arquivo de configuração config.json.

Para definir os limites para incidentes de hardware, no menu Admin, selecione Configuração e acesse a guia Incidentes.

Para Utilização da CPU, defina o seguinte:

Para definir os limites para incidentes de hardware, no menu Admin, selecione Configuração e acesse a guia Incidentes.

ChaveObrigatório?Descrição
GravidadeObrigatório

Consulte Nível de severidade do incidente.

ProcessoObrigatórioO limite se aplica a todo o Tableau Server ou a um único processo conforme especificado.
Limite inicialObrigatórioA utilização da CPU deve exceder o valor especificado antes que um incidente seja criado e monitorado. Defina a porcentagem e a duração desse limite.
Limite finalOpcionalA utilização da CPU deve ficar abaixo do valor especificado antes que um incidente seja considerado resolvido.

Para memória disponível, defina o seguinte:

ChaveObrigatório?Descrição
GravidadeObrigatório

Consulte Nível de severidade do incidente.

Limite inicialObrigatórioA memória disponível deve ficar abaixo do valor especificado antes que um incidente seja criado e monitorado. Defina a porcentagem e a duração desse limite.
Limite finalOpcionalA memória disponível deve ficar acima do valor especificado antes que um incidente seja considerado resolvido.

Para Utilização da memória, defina o seguinte:

ChaveObrigatório?Descrição
GravidadeObrigatório

Consulte Nível de severidade do incidente.

ProcessoObrigatórioO limite se aplica a todo o Tableau Server ou a um único processo conforme especificado.
Limite inicialObrigatórioA utilização da memória deve ser igual ao valor especificado antes que um incidente seja criado e monitorado. Defina a porcentagem e a duração desse limite.
Limite finalOpcionalA utilização da memória deve ficar abaixo do valor especificado antes que um incidente seja considerado resolvido.

Para espaço em disco livre, defina o seguinte:

ChaveObrigatório?Descrição
GravidadeObrigatório

Consulte Nível de severidade do incidente.

Limite inicialObrigatórioO espaço em disco livre deve ficar abaixo do valor especificado antes que um incidente seja criado e monitorado. Defina a porcentagem e a duração desse limite.
Limite finalOpcionalO espaço em disco livre deve ficar acima do valor especificado antes que um incidente seja considerado resolvido.

Para Tamanho da fila em disco, defina o seguinte:

ChaveObrigatório?Descrição
GravidadeObrigatório

Consulte Nível de severidade do incidente.

Limite inicialObrigatórioO tamanho da fila em disco deve ser igual ao valor especificado antes que um incidente seja criado e monitorado. Defina a porcentagem e a duração desse limite.
Limite finalOpcionalO tamanho da fila em disco deve ficar abaixo do valor especificado antes que um incidente seja considerado resolvido.

Um trecho do exemplo de config.json definindo dois incidentes de hardware:

{  
 "monitoring":  {  
    "incidents":  {  
      "triggers":  [  
        {  
          "counter":  "DiskSpaceAvailableKB",  
          "severity":  "warning",  
          "threshold":  1048576  
        },  
        {  
          "counter":  "ProcessorTimePercent",  
          "severity":  "warning",  
          "threshold":  0.95,  
          "thresholdDuration":  300000,  
          "endThreshold":  0.90,  
          "endThresholdDuration":  5000  
        }  
      ]  
    }  
  }  
}
  • O incidente DiskSpaceAvailableKB acionará um aviso quando o espaço em disco disponível ficar abaixo de 10 GB.
  • O incidente ProcessorTimePercent acionará um aviso assim que a CPU tiver pelo menos 95% de utilização por mais de 5 minutos. O incidente será considerado resolvido após a utilização da CPU abaixo, de 90% para 5 segundos.

As configurações padrão podem ou não atender aos requisitos, e podem ser alteradas com base no seu ambiente. Como exemplo, para um ambiente, cujo identificador era “staging-environment”, acionar um aviso quando o espaço em disco disponível ficar abaixo de 2 GB, a configuração teria a seguinte aparência:

{  
  "environments":  {  
    "staging-environment":  {  
     "monitoring":  {  
        "incidents":  {  
          "triggers":  [  
            {  
              "counter":  "DiskSpaceAvailableKB",  
              "severity":  "warning",  
              "threshold":  2097152  
            }  
          ]  
        }  
      }  
    }  
  }  
}
ChaveTipo de dadosObrigatório?Descrição
counterCadeia de caracteresObrigatório

O identificador do incidente de hardware a ser monitorado. As opções disponíveis são:

  • ProcessorTimePercent
  • DiskSpaceAvailableKB
  • DiskQueueTotalLength
  • MemoryAvailableKB
  • MemoryCommittedKB
severityCadeia de caracteresOpcional

Consulte Nível de severidade do incidente. Valor padrão: Warning

thresholdNúmeroObrigatórioO limite que deve ser excedido antes que um incidente seja monitorado.
thresholdDurationNúmeroOpcionalA quantidade de tempo em milissegundos para monitorar a situação antes de acionar um incidente. Se não especificado, um incidente será acionado assim que o threshold for alcançado.
endThresholdNúmeroOpcionalO limite que deve ser excedido antes que um incidente seja considerado resolvido.
endThresholdDurationNúmeroOpcionalA quantidade de tempo em milissegundos para monitorar a situação antes de concluir um incidente. Se não especificado, um incidente será resolvido assim que o endThreshold for alcançado. Se endThreshold não estiver definido, threshold será usado.

Quem pode fazer isso

O administrador do Resource Monitoring Tool ou um usuário do Resource Monitoring Tool com função Gerente de servidor/ambiente.

Agradecemos seu feedback!Seu feedback foi enviado. Obrigado!