Agentic Lab ускорила масштабирование ИИ‑помощника для юристов с двух дней до 10 минут в облаке Cloud.ru
Почему разработчик ИИ-решений выбрал Cloud.ru, как развернул интеллектуального помощника для работы с документами и получил возможность масштабировать вычислительные мощности за минуты без инвестиций в собственную GPU-инфраструктуру.
О компании
Agentic Lab — продуктово-сервисная компания, разрабатывающая ИИ-решения для автоматизации бизнес-процессов. Компания создает собственные продукты и помогает крупным организациям внедрять технологии искусственного интеллекта.
Одно из ключевых решений Agentic Lab — ИИ-помощник «Агата» для работы с документами. Он помогает юридическим командам анализировать большие массивы данных, извлекать важную информацию и быстро находить нужные сведения в тысячах документов.
Задача
Agentic Lab разрабатывает ИИ-продукты и помогает компаниям внедрять технологии искусственного интеллекта. Для таких решений критически важны доступность вычислительных ресурсов, возможность быстро масштабировать нагрузку и контролировать затраты на инфраструктуру.
При развитии ИИ-помощника «Агата» компания столкнулась с распространенной для рынка задачей: традиционные подходы к использованию GPU-инфраструктуры требуют либо значительных капитальных затрат на закупку собственного оборудования, либо аренды выделенных ресурсов, которые необходимо оплачивать независимо от фактической загрузки.
Дополнительным требованием стало соблюдение требований к хранению и обработке данных на территории РФ, что особенно важно для клиентов из юридической сферы.
Для дальнейшего развития продукта Agentic Lab требовалась облачная платформа, которая обеспечит доступ к современным GPU-ресурсам, позволит быстро масштабировать вычислительные мощности по мере роста нагрузки и исключит необходимость инвестировать в собственную инфраструктуру.
Почему Cloud.ru
Ключевым фактором выбора Cloud.ru стала возможность использовать GPU-ресурсы по модели pay-as-you-go (по мере потребления). Такой подход позволяет Agentic Lab гибко масштабировать вычислительные мощности: запускать модели только при поступлении запросов и не платить за простаивающие ресурсы.
Дополнительными преимуществами стали:
- доступ к высокопроизводительным GPU для задач генеративного ИИ;
- возможность быстро масштабировать вычислительные мощности;
- соответствие требованиям российского законодательства по работе с данными (соответствие требованиям 152-ФЗ и требованиям ФСТЭК России в области защиты информации);
- единая экосистема сервисов для развития ИИ-продуктов.
Для нас было важно выбрать облачную платформу, которая позволит быстро запускать и масштабировать ИИ-продукты без необходимости инвестировать в собственную GPU-инфраструктуру. Благодаря сервисам Cloud.ru мы можем гибко наращивать вычислительные мощности по мере роста нагрузки, оплачивать только фактически потребленные ресурсы и соблюдать требования к безопасности и хранению данных. Это позволяет нам сосредоточиться на развитии продукта и запуске новых ИИ-сервисов для клиентов.
Решение
ИИ-помощник «Агата» развернут на базе сервисов Cloud.ru. Для работы языковых моделей Agentic Lab выбрала сервис Evolution ML Inference с моделью оплаты рay-as-you-go. Решение работает на разделяемых GPU-ресурсах (Shared GPU), которые автоматически выделяются в зависимости от текущей нагрузки. Такой подход позволяет гибко масштабировать вычислительные мощности и оптимизировать затраты за счет оплаты только фактически потребленных ресурсов.
Для решения различных задач используются две ключевых модели:
- Mistral отвечает за извлечение метаданных, выделение сущностей и структурирование документов;
- Gemma обеспечивает интеллектуальный поиск, суммаризацию материалов и работу диалогового интерфейса.
Бизнес-логика приложения, а также фронтенд и бэкенд размещены в сервисе Evolution Compute.
После загрузки документов, сканов и фотографий система автоматически обрабатывает содержимое файлов: распознает текст, извлекает ключевые сущности и метаданные, определяет участников и события и формирует единую базу знаний. На ее основе пользователи могут выполнять поиск на естественном языке, строить хронологию событий по делу и получать ответы со ссылками на первоисточники.
В результате специалисты работают через единый интерфейс вместо разрозненных архивов и файловых хранилищ, быстрее находят нужные документы и получают структурированную информацию по делу.
Результаты
Переход на инфраструктуру Cloud.ru позволил Agentic Lab повысить гибкость вычислительных ресурсов, ускорить работу ИИ-сервисов и снизить стоимость их масштабирования. Вот ключевые результаты внедрения:
- Масштабирование инфраструктуры за 5-10 минут. При росте нагрузки компания может оперативно подключать дополнительные GPU-ресурсы. При использовании выделенной инфраструктуры аналогичный процесс обычно занимает от одного до двух дней.
- Отсутствие капитальных затрат на GPU-инфраструктуру. Компания использует модель оплаты по мере потребления вместо закупки собственного оборудования стоимостью в несколько миллионов рублей за GPU-карту.
- Сокращение времени анализа документов. После обработки документов система автоматически формирует хронологию событий по делу, помогая быстрее работать с большими массивами информации. Скорость обработки зависит от количества и объема документов.
- Автоматизация рутинных операций. ИИ-помощник берет на себя часть административной и документарной работы, позволяя юристам выполнять такие задачи примерно в два раза быстрее.
- Стабильная производительность под нагрузкой. Среднее время ответа ИИ-помощника составляет около 15-20 секунд.
Сегодня скорость запуска и масштабирования ИИ-сервисов напрямую влияет на эффективность бизнеса. Проект Agentic Lab показывает, как облачная инфраструктура ускоряет развитие ИИ-продуктов, обеспечивает гибкое масштабирование вычислительных ресурсов под задачи и снижает нагрузку на инфраструктурные операции, позволяя командам быстрее развивать и улучшать сервисы.
Планы развития
В дальнейшем Agentic Lab планирует масштабировать ИИ-платформу «Агата», наращивая нагрузку и развивая новые сценарии интеллектуальной работы с документами на базе сервисов Cloud.ru.
В ближайших планах:
- масштабирование продукта «Агата» на новые категории клиентов;
- увеличение потребления GPU-ресурсов по мере роста пользовательской базы;
- перенос дополнительных компонентов инфраструктуры в Cloud.ru;
- запуск новых ИИ-продуктов на базе Evolution ML Inference;
- консолидация инфраструктуры в Cloud.ru, включая перенос базы данных PostgreSQL и других компонентов платформы;
- развитие функциональности «Агаты», включая генерацию процессуальных документов и интеграцию с нормативно-правовыми базами.
