Up/Down alert by threshold

Started by enp, May 20, 2012, 08:08:15 PM

Previous topic - Next topic

enp

Здравствуйте!

Как правильно генерировать алармы на превышение какого-нибудь DCI, чтобы они не появлялись при каждом опросе и исчезали после снижения значения параметра?

Сейчас я сделал так: для параметра из Data Collection Configuration в Thresholds добавил соответствующую строку с Activation event = SYS_THRESHOLD_REACHED и Deactivation event = SYS_THRESHOLD_REARMED, далее в Event Processing Policy на событие SYS_THRESHOLD_REACHED добавил генерацию аларма с сообщением "Limit is reached for %2".

Значение параметра периодически изменяется, все значения выше того, что было определено в Thresholds, и в результате я получаю множество одинаковых алармов, а хотелось бы видеть лишь первый (чтобы узнать, когда значение параметра впервые было превышено) ну или хотя бы последний. Кроме того, хотелось бы, чтобы аларм исчез после того, как значение параметра окажется ниже, чем определено в Thresholds.

Как все это сделать?

enp

Настроил в Event Processing Policy реакцию на SYS_THRESHOLD_REACHED и SYS_THRESHOLD_REARMED по аналогии с SYS_NODE_DOWN и SYS_NODE_UP (см. аттач) - после этого алармы стали появляться (только один раз) и исчезать. Однако все хорошо лишь до тех пор, пока у ноды не появляется более одного параметра, требующего отслеживания - в этом случае я хочу увидеть два аларма, но вижу лишь один, а с отменой вообще творится нечто неописуемое.

Может вместо %i я должен использовать что-то другое? Что и какие варианты вообще бывают?

enp

Добавил к %i еще %1 (имя параметра), а %m заменил на %6 (тег, описываемый индивидуально для каждого порогового значения) - цифры взял из описания событий в Event Configuration. Теперь вроде все устраивает.

Очень странно, что описания реакции на SYS_THRESHOLD_REACHED и SYS_THRESHOLD_REARMED нет в дефолтных настройках. Существуют другие сценарии их использования?

enp

Да, расскажите еще, как определить два последовательных критических значения для одного параметра, чтобы при превышении первого я получал Minor, а при превышении второго - Major? Сейчас я получаю всего лишь Warning, как это определено в описании SYS_THRESHOLD_REACHED. Переопределить это можно в Event Processing Policy, однако там опять же предполагается использовать заранее заданное значение, а не получать его в виде параметра.

Для события SYS_THRESHOLD_REACHED прямо-таки напрашивается еще один параметр (аналогичный тегу) для определения серьезности превышения порогового значения. Без него придется заводить копию SYS_THRESHOLD_REACHED с именем вроде SYS_THRESHOLD_MAJOR_REACHED и дублировать описание реакции в Event Processing Policy

Victor Kirhenshtein

Quote from: enp on May 21, 2012, 10:40:37 AM
Да, расскажите еще, как определить два последовательных критических значения для одного параметра, чтобы при превышении первого я получал Minor, а при превышении второго - Major? Сейчас я получаю всего лишь Warning, как это определено в описании SYS_THRESHOLD_REACHED. Переопределить это можно в Event Processing Policy, однако там опять же предполагается использовать заранее заданное значение, а не получать его в виде параметра.

Для события SYS_THRESHOLD_REACHED прямо-таки напрашивается еще один параметр (аналогичный тегу) для определения серьезности превышения порогового значения. Без него придется заводить копию SYS_THRESHOLD_REACHED с именем вроде SYS_THRESHOLD_MAJOR_REACHED и дублировать описание реакции в Event Processing Policy

Вообщем-то так и предполагается, что создаются разные события для разных уровней серьезности.