tocdepth

2

Правила аварий по метрикам

Чтобы оперативно реагировать на отклонения от нормы, происходящие в продуктах Cloud.ru, можно использовать правила аварий. Для этого нужно настроить правило, задав в нем условия создания и обновления аварий.

Перед началом работы с правилами аварий

Чтобы начать работу с правилами аварий:

  1. Зарегистрируйтесь в личном кабинете Cloud.ru.

    Если вы уже зарегистрированы, войдите под своей учетной записью.

  2. Убедитесь, что для работы в проекте у вас достаточно прав. Настройте права самостоятельно или обратитесь к администратору.

  3. В меню разделов выберите Мониторинг → Аварии → Правила аварий по метрикам.

Откроется форма со списком настроенных правил и доступными функциями.

Просмотр списка правил

Раздел Правила аварий по метрикам содержит список настроенных правил, по каждому из которых можно посмотреть ключевые параметры:

  • статус — Включено или Выключено;

  • название правила;

  • группа;

  • важность, которая будет присвоена аварии.

В работе с правилами аварий можно:

  • обновить список;

  • отфильтровать записи по состоянию с помощью предустановленных профилей фильтрации и сортировки: все правила или только включенные;

  • включить или выключить выбранное правило;

  • найти нужное правило по названию.

Кроме этого, можно создать новое, изменить существующее или удалить ненужное правило.

Создание правила аварий

Создать правило аварий можно с нуля или путем копирования параметров существующей записи.

  1. В форме списка правил нажмите Создать правило.

  2. Задайте параметры нового правила:

    • Название и описание правила. Если в описании правила указать метки, то на основе значений этих меток или лейблов будет сформировано описание аварии.

    • Группу — выберите из списка.

      Подсказка

      Если нужного параметра нет в списке, добавьте его: в поле Группа введите название новой группы и нажмите Enter.

    • Условие срабатывания правила и пороговое значение. Например: count({__name__!="1"}) by (product_type) > 1000, где:

      • count({__name__!="1"}) by (product_type) — условие срабатывания правила;

      • > 1000 — пороговое значение.

    • Временной промежуток, за который будет проверяться условие срабатывания правила.

    • Частоту выполнения проверки на соответствие указанному правилу.

    • В поле Объект укажите идентификатор объекта, название лейбла, из которого будет браться идентификатор объекта ({{.label}}) или фиксированное значение.

    • В поле Имя объекта укажите {{.label}} — название объекта, которое будет отображаться на аварии, или фиксированное значение.

    • В поле Ресурс укажите идентификатор ресурса, название лейбла, из которого будет браться идентификатор ресурса ({{.label}}) или фиксированное значение.

    • Автозакрытие аварии — по умолчанию опция включена — в этом случае авария будет завершаться автоматически. Если опцию отключить, то аварию можно завершить только вручную.

    • (Опционально) Период автозакрытия аварии — параметр доступен, если включено автозакрытие аварии.

      Если проставить период автозакрытия вручную, а потом изменить интервал проверки, то значение в поле Период автозакрытия автоматически пересчитается. Если поле оставить пустым, то авария закроется автоматически через 30 мин.

    • Важность, выбранная в настройках правила, будет присвоена аварии.

    • С помощью Добавить метку укажите необходимое количество меток, их название и значение. Метку ({{.label}} или фиксированное значение) можно добавить в описание правила. В дальнейшем метка появится на аварии.

    • С помощью переключателя выберите: будет ли правило включено или выключено после создания.

      Подсказка

      Аварии создаются или обновляются только в соответствии с включенными правилами.

  3. Сохраните новые значения.

Редактирование параметров правила

  1. В строке нужной записи нажмите Прикрепить файл и выберите Редактировать.

  2. Внесите изменения и нажмите Сохранить.

Удаление правила

  1. В строке нужной записи нажмите Прикрепить файл и выберите Удалить.

  2. Введите название правила и подтвердите действие.

Выключение и повторное включение правила

Активное правило можно отключить. Для этого в строке записи нажмите Прикрепить файл и выберите Выключить. Или отфильтруйте список по признаку Активные правила, выделите флагом нужную запись и нажмите Выключить. Правило отключено.

Чтобы вновь активировать правило, в строке нужной записи нажмите Прикрепить файл и выберите Включить. Или отфильтруйте список по признаку Все правила, выделите флагом неактивную запись и нажмите Включить. Правило активировано.

Запустили Evolution free tier
для Dev & Test
Получить