Contents Previous Next

Comando mtmon_evento.pl

Este é o comando usado para incluir um evento no MTMON. Pode ser acionado com os seguintes parâmetros :

    --aplicacao
    --debug
    --dump
    --email
    --eventual
    --finaliza
    --limite
    --informacao ou --info
    --mensagem
    --notifica
    --objeto
    --repete
    --servidor
    --severidade

Os campos obrigatórios são : --servidor, --aplicacao, --severidade e --mensagem.

--servidor

É o nome do servidor/equipamento onde ocorreu o fato gerador do evento. O nome é livre e pode ser usado qualquer seqüência de letras e números. Não é realizada nenhuma verificação de IP e/ou DNS. O objetivo é que o MTMON seja flexível e usado em aplicações que podem ter uma nomenclatura não relacionada com TI.

Se definida a variável Server no arquivo de parâmetros, então --servidor é opcional, pois o comando recuperará a informação do mesmo.

Por exemplo, o comando poderia ser chamado com a opção --servidor fresadora07, para definir que o evento ocorreu numa fresadora denominada fresadora07, sendo que este equipamento não necessariamente está conectado numa rede TCP/IP. O evento poderia ser identificado e gerado por um programa que monitora o equipamento usando uma porta serial RS232C ou RS422C.

--aplicacao

Também livre a ser definido pelo administrador do MTMON.

--severidade

Todos eventos devem ter um severidade definida. Existem 3 níveis de severidade e os procedimentos e ações à serem tomadas em cada caso, devem ser definidas pelo Administrador do MTMON. A severidade segue o padrão definido para os plugins do Nagios. Consulte o link do Nagios para maiores informações. Estes plugins podem ser usados para monitorar eventos.

O Nagios não é pré-requisito para o MTMON. Cada usuário pode desenvolver seus plugins e finalizar os scripts com return code igual a 0, 1 ou 2, que determinará a severidade associada ao evento :

Os critérios sobre que severidade deve ser atribuída para cada evento é produto de um planejamento entre o Administrador do MTMON e as áreas envolvidas no processo monitorado. A documentação dos eventos e os procedimentos a serem adotados fazem a diferença quando o fato gerador ocorre. A pró-atividade resultante deste planejamento gera economia, pois o tempo de identificação até o endereçamento de uma solução minimizará o prejuízo resultante da parada do processo.

Se uma severidade diferente de 0, 1 ou 2 for informada, o MTMON o converte para 2, pois um sério erro de definição ocorreu. Neste caso, não há como definir a real situação do fato gerador e isso deve ser obrigatóriamente corrigido.

--mensagem

Mensagem de identificação do fato gerador do evento. É apenas uma linha que descreve de forma objetiva o ocorrido. Se existem outras informações relevantes ao evento, salve estas informações numa arquivo e encaminhe junto com a opção --dump.

--debug

Incrementa o número de informações apresentadas no cadastramento do evento.

--dump

Informa um nome de arquivo que será anexo ao evento e que poderá ser consultado via browser na janela de monitoração. Se o nome informado é o caracter - (traço), então a entrada padrão é usada para montar o arquivo de dump. O dump se relaciona com o evento único que está sendo gerado. Se a variável ScriptClient está definindo um script com permissão de execução, a variável $MTMON_Dump poderá ser usada para tratar o dump recebido.

O sistema MTMON está preparado para receber o anexo de --dump em qualquer formato disponível, pois os dados são transferidos para o servidor no formato binário.

--email

Repassa para os scripts os emails que podem ser usados para acionar alguém responsável pelo evento. Os emails serão repassados via variáveis de shell.

--eventual

Um incidente pode ser do tipo contínuo ou eventual.

Incidentes contínuos são do tipo que a mudança de estado estabelece uma parada no serviço, como por exemplo um link de dados.

A opção --eventual define que o incidente é pontual, ou seja, não tem qualquer relação com qualquer outro incidente passado ou futuro.

Por exemplo, o cancelamento de um programa numa rotina batch pode gerar um evento único que não tem qualquer relação com as demais execuções da mesma rotina.

--informacao

Informa um parâmetro que é o nome de um arquivo que existe no diretório dirInfo. Na janela de monitoração é criado um link que permitirá consultar o arquivo ou a URL informada. Se o arquivo não existe, a informação é apresentada sem link.

Só é permitida a definição de 1 argumento para --informacao.

O arquivo pode ser de qualquer tipo suportado pelo sistema operacional que está com a janela de monitoração, como por exemplo, .pdf ou .doc. Consulte a definição de SufixoInfo para maiores informações.

Exemplos :

    --informacao links.pdf

    --informacao links

    --informacao http://www.endereco.com/programa.cgi?param1=1+param2=2

Se existir um arquivo chamado dirInfo/links.pdf, este poderá ser consultado na janela de monitoração pelo operador.

O segundo exemplo procura no diretório dirInfo por um arquivo chamado links. Se não encontrar, continua a busca com os sufixos definidos no parâmetro SufixoInfo do arquivo mtmon.conf.

O terceiro exemplo abre uma janela com a URL definida na opção. Sempre que o parâmetro iniciar com http: ou https:, a CONSOLE interpreta como uma URL que será chamada numa nova janela.

Este procedimento pode minimizar a necessidade de acionar recursos desnecessários, uma vez que pode conter dicas, diretrizes e/ou procedimentos para tratar o fato gerador do evento.

No caso de um evento que monitora um link de comunicação, o arquivo poderia conter o número do telefone para abrir um chamado em caso de queda do link, pessoas de contato que devem ser acionadas, procedimentos de validação e/ou recuperação do link, etc. O conteúdo do arquivo é de responsabilidade do administrador do MTMON.

Vale salientar que --dump e --informacao são complementares, pois enquanto --dump disponibiliza uma informação relevante a um evento específico, o parâmetro --informacao define um procedimento para resolver o problema, podendo usar as informações disponibilizadas via --dump.

--finaliza

Quando o evento é de severidade 0 (normal) ele pode ser finalizado no momento do cadastro. Este tipo de evento pode ser usado para gerar um registro do fato gerador relacionado ao evento. Neste caso fica definido que não é necessária nenhuma ação da parte do operador que monitora o MTMON, e o evento pode ser consultado via browser clicando no botão Histórico.

Eventos com severidade 1 (alerta) ou 2 (crítico) não admitem a finalização automática. Neste caso, o parâmetro é ignorado. Isto ocorre porque para estes níveis de severidade uma ação do operador é exigida (por exemplo ligar para o responsável) e um registro sobre o procedimento adotado deve ser incluído clicando no botão Nota.

--limite n,m

Define quantos eventos serão gerados quando a severidade é maior que 0. O programa enviará os primeiros n eventos para o servidor e depois com periodicidade m. Para converter o tempo em m, divida o tempo desejado pela periodicidade que a monitoração é realizada.

Exemplos :

   --limite 3,36

Se a monitoração é realizada à cada 5 minutos, serão gerados 3 eventos iniciais nos minutos 0, 5 e 10. Depois de 36 x 5min = 180min (3 horas), se a severidade do evento não foi alterada, será gerado um novo evento. Eventos serão criados de 3 em 3 horas. Se a severidade diminuir, 1 evento novo será gerado. Se a severidade aumentar, 3 novos eventos serão gerados e o ciclo de 3 horas é reiniciado.

   --limite 2,9

Se a monitoração é realizada à cada 20 minutos, serão gerados 2 eventos iniciais nos minutos 0 e 20. Depois de 9 x 20min = 180min (3 horas), se a severidade do evento não foi alterada, será gerado um novo evento.

--notifica

Este parâmetro se relaciona com os parâmetros ScriptServer e/ou ScriptClient definidos no arquivo de parâmetros. Quando o script é chamado, uma das variáveis definidas é MTMON_Notifica. O script pode assim identificar eventuais usuários/responsáveis pelo evento que está gerando a notificação.

Além desta função, na CONSOLE de monitoração é criado um link de define o procedimento que o operador deve executar. Este procedimento é realizado consultando o link que é gerado.

Por exemplo, chamando o comando com a opção --notifica ORACLE e definindo a variável ScriptServer=/usr/local/bin/TrataEvento.sh, o servidor MTMON acionará o script definido em ScriptServer e/ou ScriptClient. O script executado receberá variáveis pertinentes ao evento.

O script poderia ter o seguinte código :

    for Grupo in $MTMON_Notifica
    do
      case "$Grupo" in
      ORACLE) echo "Manda SMS para responsavel do ORACLE"
              ...
      ;;
      UNIX) echo "Manda email para responsavel do UNIX"
              ...
      ;;
      esac
    done

Observe que se --notifica não for informado, a variável $MTMON_Notifica estará em branco e o script não enviará nenhum email.

--objeto

Livre a ser definido pelo administrador do MTMON. Permite uma identificação mais precisa do equipamento/módulo/função onde ocorreu o fato gerador do evento.

--repete

Se a combinação de Origem (opcional definido no arquivo de parâmetros), --servidor, --aplicacao, --objeto (se definido) e --severidade existe na tela de monitoração, então não será gerado um novo evento. A informação é incluída no último evento com os mesmos atributos e na janela de monitoração é apresentado quantas vezes o evento foi repetido. Isto é útil quando existe um fato gerador que se repete e que a solução ainda não está disponível ou implementada.


Contents Previous Next