Центр аварий
В этом разделе — инструкции по просмотру аварий и событий, созданию правил для пороговых значений, настройке оповещений об авариях.
Просмотр аварий
При неправильной работе сервисов ServiceStage, Cloud Container Engine или Application Performance Management в разделе Alarms отображаются аварии.
-
Войдите в консоль управления Advanced:
-
В списке сервисов выберите Application Operations Management.
-
Нажмите Alarm Center → Alarms.
-
На странице Alarms:
-
установите временной период;
-
задайте фильтры и нажмите Search. Для сброса нажмите Reset.
-
Также можно просматривать статистику и детали аварий.
Просмотр событий
События отображают информацию об изменениях в сервисах ServiceStage, Cloud Container Engine или Application Performance Management.
-
Войдите в консоль управления Advanced:
-
В списке сервисов выберите Application Operations Management.
-
Нажмите Alarm Center → Events.
-
На странице Events:
-
установите временной период;
-
задайте фильтры и нажмите Search. Для сброса нажмите Reset.
-
Также можно просматривать статистику событий.
Создание правил с пороговыми значениями
С помощью правил можно установить пороговые значения для метрик ресурсов. При изменении статуса порогового правила (Exceeded, Insufficient или ОК) уведомления будут отправляться по электронной почте.
Можно создать максимум 1000 правил с пороговыми значениями.
Перед началом работы
Настройте политику уведомлений в консоли Simple Message Notification для оповещения по электронной почте.
-
Чтобы создать топик, войдите в консоль SMN и выберите Topic Management → Topics → Create Topic.
-
Задайте политику для созданного топика на странице Topics: в столбце Operation выберите More → Configure Topic Policy. Для параметра Services that can publish messages to this topic выберите apm.
-
Добавьте получателей: Topic Management → Subscriptions → Add Subscription. На странице выберите нужный топик и протокол, введите адрес электронной почты получателей.
Настройка правил с пороговыми значениями
-
Войдите в консоль управления Advanced:
-
В списке сервисов выберите Application Operations Management.
-
В меню слева выберите Alarm Center → Threshold Rules и нажмите Add Threshold.
-
Чтобы настроить правила:
-
На вкладке Select Resource укажите название правила, тип ресурса и выберите ресурсы для мониторинга. Нажмите Next.
ПримечаниеМожно выбрать до 10 ресурсов.
-
На вкладке Define Threshold выберите метрику для мониторинга и задайте параметры:
-
Metric Name — название метрики.
-
Threshold Condition — условия срабатывания порогового правила.
-
Consecutive Period (s) — период для срабатывания порогового правила.
-
Alarm Severity — тип аварии.
-
Statistic Method — метод, используемый для измерения значений показателей.
-
Statistical Cycle — интервал, с которым собираются данные метрики.
-
Send Notification — настройка отправки уведомлений по электронной почте при изменении статуса (Exceeded, OK или Insufficient) порогового правила.
-
-
-
Чтобы завершить настройку, нажмите Submit.
Настройка оповещений об авариях
AOM поддерживает функцию уведомления об авариях.
-
Чтобы создать правило об уведомлении, войдите в консоль AOM.
-
Нажмите Alarm Center → Notification Rules → Create Notification Rule.
-
Укажите название правила, выберите тип аварии, созданный топик и целевой кластер, нажмите Create.
Во время выбора топика отображается сообщение «Sorry, you do not have the permission to access Simple Message Notification». Это связано с тем, что вы вошли в AOM как IAM-пользователь, у которого нет разрешения на доступ к SMN. Необходимо связаться с администратором (учетная запись, которой принадлежит IAM-пользователь), чтобы добавить разрешение на доступ к SMN.
- Просмотр аварий
- Просмотр событий
- Создание правил с пороговыми значениями
- Настройка оповещений об авариях