В этом разделе — инструкции по просмотру аварий и событий, созданию правил для пороговых значений, настройке оповещений об авариях.
При неправильной работе сервисов ServiceStage, Cloud Container Engine или Application Performance Management в разделе Alarms отображаются аварии.
Войдите в консоль управления Advanced:
В списке сервисов выберите Application Operations Management.
Нажмите Alarm Center → Alarms.
На странице Alarms:
установите временной период;
задайте фильтры и нажмите Search. Для сброса нажмите Reset.
Также можно просматривать статистику и детали аварий.
События отображают информацию об изменениях в сервисах ServiceStage, Cloud Container Engine или Application Performance Management.
Войдите в консоль управления Advanced:
В списке сервисов выберите Application Operations Management.
Нажмите Alarm Center → Events.
На странице Events:
установите временной период;
задайте фильтры и нажмите Search. Для сброса нажмите Reset.
Также можно просматривать статистику событий.
С помощью правил можно установить пороговые значения для метрик ресурсов. При изменении статуса порогового правила (Exceeded, Insufficient или ОК) уведомления будут отправляться по электронной почте.
Можно создать максимум 1000 правил с пороговыми значениями.
Настройте политику уведомлений в консоли Simple Message Notification для оповещения по электронной почте.
Чтобы создать топик, войдите в консоль SMN и выберите Topic Management → Topics → Create Topic.
Задайте политику для созданного топика на странице Topics: в столбце Operation выберите More → Configure Topic Policy. Для параметра Services that can publish messages to this topic выберите apm.
Добавьте получателей: Topic Management → Subscriptions → Add Subscription. На странице выберите нужный топик и протокол, введите адрес электронной почты получателей.
Войдите в консоль управления Advanced:
В списке сервисов выберите Application Operations Management.
В меню слева выберите Alarm Center → Threshold Rules и нажмите Add Threshold.
Чтобы настроить правила:
На вкладке Select Resource укажите название правила, тип ресурса и выберите ресурсы для мониторинга. Нажмите Next.
Можно выбрать до 10 ресурсов.
На вкладке Define Threshold выберите метрику для мониторинга и задайте параметры:
Metric Name — название метрики.
Threshold Condition — условия срабатывания порогового правила.
Consecutive Period (s) — период для срабатывания порогового правила.
Alarm Severity — тип аварии.
Statistic Method — метод, используемый для измерения значений показателей.
Statistical Cycle — интервал, с которым собираются данные метрики.
Send Notification — настройка отправки уведомлений по электронной почте при изменении статуса (Exceeded, OK или Insufficient) порогового правила.
Чтобы завершить настройку, нажмите Submit.
AOM поддерживает функцию уведомления об авариях.
Чтобы создать правило об уведомлении, войдите в консоль AOM.
Нажмите Alarm Center → Notification Rules → Create Notification Rule.
Укажите название правила, выберите тип аварии, созданный топик и целевой кластер, нажмите Create.
Во время выбора топика отображается сообщение «Sorry, you do not have the permission to access Simple Message Notification». Это связано с тем, что вы вошли в AOM как IAM-пользователь, у которого нет разрешения на доступ к SMN. Необходимо связаться с администратором (учетная запись, которой принадлежит IAM-пользователь), чтобы добавить разрешение на доступ к SMN.