AI-агент — интеллектуальная система, способная самостоятельно воспринимать окружающую среду через MCP-серверы, анализировать результат их выполнения и предпринимать целенаправленные действия для решения поставленных задач.
Вы можете создавать агента самостоятельно или выбрать из каталога.
Убедитесь, что у вас подключены сервисы ML Inference и Foundation Models. Без этого не получится создавать агентов и агентные системы.
Для создания AI-агента:
Авторизуйтесь в личном кабинете.
На верхней панели слева нажмите и перейдите в AI Factory → AI Agents → AI-агенты.
Нажмите Создать агента.
Выберите способ создания агента:
Простой агент — не требует написания кода, создается на основе Docker-образа по умолчанию, вам необходимо задать минимальные настройки.
Агент из Docker-образа — потребует загрузки вашего Docker-образ в Artifact Registry. Самый кастомизируемый вариант.
В зависимости от вашего выбора дальнейшие действия будут немного отличаться.
Введите Название и при необходимости добавьте описание.
В блоке Модель и конфигурация:
Выберите источник модели:
Выберите одну из популярных моделей. Для просмотра всех доступных моделей нажмите Показать еще.
Выберите конфигурацию агента.
В блоке Инструкция для агента:
Выберите MCP-сервер. Доступны MCP-серверы в статусе «Запущен» или «Ожидает запроса», а также серверы из каталога.
Вы можете выбрать больше одного MCP-сервера.
(Опционально) Настройте инструменты для сервера. Вы можете включать и выключать их. Для этого нажмите на название инструмента в карточке сервера.
(Опционально) Если вы хотите реализовать хореографию агентов, добавьте Связанных агентов.
Введите Системный промпт. Чтобы сгенерировать или улучшить промпт, нажмите Режим AI-генерации.
Вы также можете использовать заранее созданные промпты.
Нажмите Продолжить.
(Опционально) Настройте Генерацию ответа. Доступны два способа генерации:
Выберите Температуру.
Чем выше температура, тем более креативные ответы будет давать модель.
Выберите Максимум токенов в ответе.
Чем больше токенов, тем объемнее ответ будет давать модель.
(Опционально) Настройте Размышления агента. Если опция активирована:
Выберите Уровень детализации размышлений — чем он выше, тем более подробно агент описывает свои рассуждения.
Выберите Бюджет токенов на размышления — общий лимит на шаги в рамках размышлений.
(Опционально) Настройте Надежность и контекст:
Выберите Максимум вызовов на задачу.
Опция защищает от зацикливания при обращении агента к LLM-модели или MCP-серверу.
Настройте Повтор при ошибке. Если опция активирована, выберите Максимум попыток обращений.
Опция позволяет агенту направить повторное обращение к LLM-модели или MCP-серверу в случае ошибки.
Настройте Сжатие истории диалога. Если опция активирована:
Выберите Интервал сжатия сообщений — количество сообщений, которое агент объединит в краткое резюме для сохранения контекста.
Выберите Размер перекрытия — количество сообщений из предыдущего резюме, которые попадут в следующее.
Настройте Кэш диалога. Если опция активирована:
Выберите Время жизни кэша.
Выберите Частоту обновления — насколько часто агент проверяет актуальность данных.
Нажмите Продолжить.
Задайте настройки масштабирования:
Количество экземпляров — минимальное и максимальное количество экземпляров контейнера при масштабировании сервиса. При минимальном количестве экземпляров «0» — агент работает в serverless-режиме и автоматически отключается при отсутствии запросов. При поступлении новых запросов агент запускается повторно.
(Опционально) Активируйте опцию Не выключать агента, если необходимо чтобы агент всегда был запущен.
(Опционально) Укажите для агента Время жизни при отсутствии нагрузки, если не активировали предыдущую опцию.
Выберите тип масштабирования и укажите допустимое количество запросов в секунду:
RPS — запросы в секунду на экземпляр, автомасштабирование начинается при достижении заданного лимита на количество запросов в секунду на экземпляр.
Concurrency — параллельные запросы на экземпляр, автомасштабирование начинается при достижении заданного лимита на количество одновременных запросов на экземпляр.
(Опционально) Активируйте опцию Аутентификация для аутентификации пользователя при вызове модели через публичный URL. Настройте аутентификацию:
Тип аутентификации — выберите «Ключ доступа» или «API-ключ».
Сервисный аккаунт — выберите, создайте вручную или автоматически сервисный аккаунт.
При создании сервисного аккаунта для него необходимо создать ключ в соответствии с выбранным типом аутентификации.
(Опционально) Активируйте опцию Логирование запросов для ведения журнала запросов к агенту. Укажите лог-группу.
Нажмите Создать и дождитесь перехода агента в статус «Запущен» или «Ожидает запроса».
После перехода агента в статус «Запущен» вы можете протестировать агента на вкладке Чат.
Для просмотра примеров использования агентов на разных языках нажмите Использовать.
Авторизуйтесь в личном кабинете.
На верхней панели слева нажмите и перейдите в AI Factory → AI Agents → Каталог → AI-агенты.
Выберите агента и нажмите Запустить.
Создайте агентную систему для различных задач с использованием полученного агента.