Evolution
Тема интерфейса

Метрики мониторинга сервиса AI Agents

Эта статья полезна?

Сервис мониторинга позволяет получать информацию о производительности ресурсов в AI Agents и включает в себя следующие дашборды:

Каждый дашборд поддерживает следующие настройки и опции:

  • Выбор периода сбора данных. По умолчанию отображаются данные за последние 2 часа.

  • Выбор интервала автообновления данных. По умолчанию обновляются каждые 5 минут.

  • Выгрузка графика в PNG-файл.

  • Просмотр графика в развернутом режиме.

Сервисные дашборды AI Agents

Для мониторинга производительности AI-агентов, агентных систем и MCP-серверов преднастроены отдельные сервисные дашборды.


Сервисный дашборд для мониторинга AI-агентов доступен в личном кабинете в разделе Мониторинг → Дашборды → Сервисные → AI Agents - Агент.

На сервисном дашборде временной интервал анализа в виджетах равен одной минуте.

Для AI-агентов преднастроены следующие виджеты и метрики, из которых они состоят:

Название виджета, Единица измерения

Название метрики

Описание

Потребление памяти, ГБ

ai_agents:system:cpu:workcload_info

Объем оперативной памяти, потребляемый агентом.

Потребление CPU, %

ai_agents:system:cpu:workcload_info

Потребление вычислительных ресурсов агентом.

Количество экземпляров, шт

ai_agents:system:online

Количество запущенных агентов на текущий момент. Может изменяться при масштабировании.

Пропускная способность, Бит/с

ai_agents:system:request:bandwidth

Объем данных, переданных по сети.

Время ответа, с

ai_agents:system:request:http_latency_bucket

Время от получения запроса до отправки ответа.

Запросов в секунду (RPS) по кодам ответа, шт/с

ai_agents:system:request:http_status

Количество успешных и ошибочных запросов, обработанных агентом.

Успешно обработанных запросов, шт/с

ai_agents:system:request:http_status

Количество успешно обработанных запросов.

Ошибочных запросов, шт/с

ai_agents:system:request:http_status

Количество запросов, обработанных с ошибкой.

Внутренние ошибки,шт/с

ai_agents:system:request:http_status

Количество запросов, которые агент не смог обработать из-за внутренних ошибок.

Пользовательские дашборды для AI Agents

Вы можете создать и настроить дашборд с виджетами по своему усмотрению.

При создании виджета укажите ai_agents:system: в поле Запрос.

Для создания виджетов доступны следующие метрики:

Метрика

Описание

ai_agents:system:cpu:workcload_info

Отображает текущую загрузку центрального процессора (CPU).

ai_agents:system:gpu:workcload_info

Отображает текущую загрузку графического процессора (GPU).

ai_agents:system:memory:workcload_info

Отображает объем используемой оперативной памяти (RAM).

ai_agents:system:online

Отображает работоспособность сервиса на текущий момент.

ai_agents:system:request:bandwidth

Отображает скорость передачи данных.

ai_agents:system:request:bytes_bucket, ai_agents:system:request:bytes_count, ai_agents:system:request:bytes_sum

Отображают размер запросов и ответов. Используются совместно для построения гистограмм и расчета среднего объема передаваемых данных.

ai_agents:system:request:duration_milliseconds_bucket, ai_agents:system:request:duration_milliseconds_count, ai_agents:system:request:duration_milliseconds_sum

Отображают время обработки запроса внутри приложения. Используются совместно для анализа производительности и построения распределения длительности обработки.

ai_agents:system:request:http_latency_bucket, ai_agents:system:request:http_latency_count, ai_agents:system:request:http_latency_sum

Отображают общее время между отправкой запроса и получением ответа. Используются совместно для оценки времени отклика сервиса.

ai_agents:system:request:http_status

Отображает количество запросов с разбивкой по кодам HTTP-ответа (2xx, 4xx, 5xx и др.).

ai_agents:system:requests_total

Отображает общее количество запросов, полученных сервисом с момента запуска.

Пример создания виджета «95-й перцентиль времени ответа»

Виджет «95-й перцентиль времени ответа» — один из ключевых индикаторов производительности сервиса. Он отражает, насколько быстро обрабатываются запросы для большинства пользователей. В отличие от среднего времени, p95 не искажается редкими длительными запросами и точнее характеризует реальный пользовательский опыт.

Для создания виджета:

  1. Откройте созданый дашборд.

  2. Нажмите Создать виджет.

  3. Выберите тип отображения данных — Временной ряд.

  4. Укажите название — 95-й перцентиль времени ответа.

  5. В поле Запрос укажите:

    histogram_quantile(0.95, sum(rate(ai_agents:system:request:duration_milliseconds_bucket[5m])) by (le))

    Где:

    • histogram_quantile(0.95, ...) — основная функция: находит значение времени, ниже которого находится 95% всех запросов.

    • ...duration_milliseconds_bucket — метрика для сортировки запросов по скорости с разбивкой на корзины (buckets).

    • sum(...) by (le) — агрегация частоты по всем экземплярам сервиса с группировкой по метке le. Метка le указывает верхнюю границу каждой корзины.

    • rate(...[5m]) — вычисляет частоту запросов, попадающих в каждую корзину (buckets).

    • [5m] — определяет временной интервал анализа — последние 5 минут.

  6. В поле Легенда укажите 95-й перцентиль (p95).

  7. Остальные параметры настройте по своему усмотрению или оставьте по умолчанию.

  8. Нажмите Сохранить.

../_images/s__monitoring__monitoring-metrics1.png

Созданный виджет отобразится на вашем дашборде.

Вы можете использовать этот виджет как инструмент мониторинга производительности. Он поможет оперативно выявлять регрессии после релизов и поддерживать высокое качество сервиса.

Подробные инструкции о работе с дашбордами читайте в документации сервиса «Мониторинг»: