Что такое событие в системе Glaber?
События в Glaber представляют собой изменения состояний триггеров, обнаружение новых хостов или элементов данных, а также процессы авторегистрации агентов. Эти события играют ключевую роль в системе мониторинга Glaber, позволяя отслеживать изменения в состоянии наблюдаемых объектов и инициировать соответствующие реакции.
Например, при изменении состояния триггера с “ОК” на “Проблема”, система может автоматически отправить уведомление ответственному персоналу или выполнить заранее настроенные действия для решения возникшей проблемы. События также используются для отслеживания изменений в инфраструктуре, таких как появление новых хостов или сервисов, что важно для обеспечения полноты мониторинга и актуальности данных.
Истиочники событий
События в Glaber создаются на основе различных источников:
- События, связанные с триггерами, возникают при изменении состояния триггера (например, переход от «ОК» к «Проблема» и обратно);
- События, связанные с обнаружением, появляются при обнаружении новых узлов сети или сервисов;
- События, связанные с автоматической регистрацией, происходят, когда активные агенты автоматически регистрируются на сервере;
- Внутренние события возникают, когда элементы данных или правила низкоуровневого обнаружения перестают поддерживаться системой, или когда триггер переходит в состояние «неизвестно».
События, связанные с триггерами
Обзор
Изменение состояния триггера является одним из основных источников событий в системе мониторинга Glaber. Когда триггер меняет своё состояние, генерируется событие, которое содержит информацию об этом изменении, включая дату и время (Мониторинг -> Проблемы).
Существует два типа событий, создаваемых триггерами:
- События проблемы — генерируются, когда выражение триггера вычисляется как истинное, если триггер находится в состоянии «ОК», или каждый раз, когда выражение триггера вычисляется как истинное, если у триггера активирована множественная генерация событий проблемы;
- События OK — закрывают связанные события о проблеме и могут быть созданы различными компонентами, включая триггеры, корреляцию событий и менеджер задач.
Триггеры
У триггеров есть две настройки, которые определяют, как генерируются события OK:
-
«Формирование событий OK» — определяет, при каких условиях генерируется событие OK. Есть три варианта:
-
Выражение — событие OK генерируется, когда выражение триггера вычисляется как ложное. Это самая простая настройка, активированная по умолчанию.
- Выражение восстановления — событие OK генерируется, когда выражение триггера вычисляется как ложное, а выражение восстановления вычисляется как истинное. Эту опцию можно использовать, если критерий восстановления триггера отличается от критерия проблемы.
-
Нет — событие OK никогда не генерируется. Эту опцию можно использовать в сочетании с множественной генерацией проблем для простой отправки оповещений, когда что-то происходит.
-
«ОК событие закрывает» определяет, какие события о проблемах закрываются событием OK. Есть два варианта:
-
Все проблемы — событие OK закрывает все открытые проблемы, созданные этим триггером;
- Все проблемы, если значение тега совпадает — событие OK закрывает все открытые проблемы, созданные этим триггером, и имеющие хотя бы одно совпадающее значение тега. Тег задаётся настройкой триггера «Теги для совпадения». Если нет никаких событий о проблемах для закрытия, то событие OK не генерируется. Эту опцию часто называют корреляцией событий на уровне триггеров.
Закрытие проблемы в ручном режиме
Хотя обычно проблемы решаются автоматически, когда состояние триггера меняется с «Проблема» на «ОК», бывают ситуации, когда сложно понять, что проблема действительно устранена. В таких случаях проблему нужно решать вручную. Когда проблему закрывают вручную, Glaber создаёт новую внутреннюю задачу для Glaber-сервера. Затем процесс Task Manager выполняет эту задачу и создаёт событие «ОК», которое закрывает событие о проблеме.
Если проблему закрыли вручную, это не значит, что основной триггер никогда больше не перейдёт в состояние «Проблема». Когда поступают новые данные от любого элемента данных, включённого в выражение триггера, происходит повторное вычисление всего выражения, что может снова привести к проблеме. Также триггер пересчитывается, когда в его выражении используются функции, связанные со временем.
События, связанные с обнаружением
Glaber регулярно проверяет IP-адреса, указанные в правилах сетевого обнаружения. Для каждого правила можно настроить индивидуальную частоту проверок. При обнаружении нового узла сети или сервиса создаётся соответствующее событие (или несколько событий).
Событие | Условия для генерации |
---|---|
Сервис доступен | Каждый раз, когда система Glaber обнаруживает активный сервис |
Сервис недоступен | Каждый раз, когда система Glaber не может обнаружить сервис |
Узел сети доступен | Если хотя бы один сервис доступен для IP |
Узел сети недоступен | Если все сервисы не доступны |
Сервис обнаружен | Если сервис стал доступен после того, как был недоступен, или обнаружен впервые. |
Сервис потерян | Если сервис стал недоступен после того, как был доступен. |
Узел сети обнаружен | Если узел сети стал доступен после того, как был недоступен, или обнаружен впервые. |
Узел сети потерян | Если узел сети стал недоступен после того, как был доступен. |
События, связанные с автоматической регистрацией
В Glaber события могут возникать в результате автоматической регистрации активных агентов. Если эта функция настроена, событие на авторегистрацию активного агента может быть создано в двух случаях:
- Когда ранее неизвестный активный агент запрашивает выполнение своих проверок;
- Когда изменяются метаданные узла сети.
В ответ на эти события сервер добавляет новый автоматически зарегистрированный узел сети, используя IP-адрес и порт, полученные от агента.
Внутренние события
Внутренние события происходят в следующих случаях:
- Элемент данных переходит из состояния «нормальный» в состояние «не поддерживается»;
- Элемент данных возвращается из состояния «не поддерживается» в состояние «нормальный»;
- Правило низкоуровневого обнаружения переходит из состояния «нормальный» в состояние «не поддерживается»;
- Правило низкоуровневого обнаружения возвращается из состояния «не поддерживается» в состояние «нормальный»;
- Триггер переходит из состояния «нормальный» в состояние «неизвестный»;
- Триггер возвращается из состояния «неизвестный» в состояние «нормальный».