yandex
Калькулятор ценТарифыАкцииДокументацияО насКарьера в Cloud.ruНовостиЮридические документыКонтактыРешенияРеферальная программаКейсыПартнерство с Cloud.ruБезопасностьEvolutionAdvancedEvolution StackОблако VMwareВ чем отличия платформ?БлогОбучение и сертификацияМероприятияИсследования Cloud.ruЛичный кабинетВойтиЗарегистрироватьсяОблако для мобильных и веб‑приложенийСайт в облакеАналитика данных в облакеХранение данных в облакеАналитика данных в облакеИнфраструктура для 1С в облакеМиграция IT‑инфраструктуры в облако3D-моделирование и рендерингРазработка и тестирование в облакеEvolution ComputeEvolution Managed KubernetesEvolution Object StorageEvolution Managed PostgreSQL®Evolution Bare MetalEvolution SSH KeysEvolution ImageEvolution DNSEvolution VPCEvolution Load BalancerEvolution Magic RouterEvolution DiskEvolution Container AppsEvolution Artifact RegistryEvolution Managed ArenadataDBEvolution Managed TrinoEvolution Managed SparkEvolution ML InferenceEvolution Distributed TrainEvolution ML FinetuningEvolution NotebooksEvolution TagsEvolution Task HistoryCurator Anti-DDoSCurator Anti‑DDoS+WAFUserGate: виртуальный NGFWStormWall: Anti-DDoSCloud MonitoringCloud LoggingАренда GPUDirect ConnectCDNCloud AdvisorCross-platform connectionAdvanced Object Storage ServiceAdvanced Elastic Cloud ServerAdvanced Relational Database Service for PostgreSQLAdvanced Image Management ServiceAdvanced Auto ScalingAdvanced Enterprise RouterAdvanced Cloud Backup and RecoveryAdvanced Data Warehouse ServiceAdvanced Elastic Volume ServiceAdvanced Cloud Container EngineAdvanced FunctionGraphAdvanced Container Guard ServiceAdvanced Software Repository for ContainerAdvanced Document Database Service with MongoDBAdvanced Relational Database Service for MySQLAdvanced Relational Database Service for SQL ServerAdvanced Server Migration ServiceAdvanced Data Replication ServiceAdvanced API GatewayAdvanced CodeArtsAdvanced Distributed Message Service for KafkaAdvanced Distributed Message Service for RabbitMQAdvanced DataArts InsightAdvanced CloudTableAdvanced MapReduce ServiceAdvanced Cloud Trace ServiceAdvanced Application Performance ManagementAdvanced Identity and Access ManagementAdvanced Enterprise Project Management ServiceVMware: виртуальный ЦОД с GPUVMware: виртуальный ЦОДУдаленные рабочие столы (VDI)VMware: резервное копирование виртуальных машинVMware: резервный ЦОДVMware: резервное копирование в облакоVMware: миграция виртуальных машин
Связаться с нами
IT-разработка

Agentic Lab ускорила масштабирование ИИ‑помощника для юристов с двух дней до 10 минут в облаке Cloud.ru

Почему разработчик ИИ-решений выбрал Cloud.ru, как развернул интеллектуального помощника для работы с документами и получил возможность масштабировать вычислительные мощности за минуты без инвестиций в собственную GPU-инфраструктуру.

О компании

инфографика

Agentic Lab — продуктово-сервисная компания, разрабатывающая ИИ-решения для автоматизации бизнес-процессов. Компания создает собственные продукты и помогает крупным организациям внедрять технологии искусственного интеллекта.

Одно из ключевых решений Agentic Lab — ИИ-помощник «Агата» для работы с документами. Он помогает юридическим командам анализировать большие массивы данных, извлекать важную информацию и быстро находить нужные сведения в тысячах документов.

Задача

Agentic Lab разрабатывает ИИ-продукты и помогает компаниям внедрять технологии искусственного интеллекта. Для таких решений критически важны доступность вычислительных ресурсов, возможность быстро масштабировать нагрузку и контролировать затраты на инфраструктуру.

При развитии ИИ-помощника «Агата» компания столкнулась с распространенной для рынка задачей: традиционные подходы к использованию GPU-инфраструктуры требуют либо значительных капитальных затрат на закупку собственного оборудования, либо аренды выделенных ресурсов, которые необходимо оплачивать независимо от фактической загрузки.

Дополнительным требованием стало соблюдение требований к хранению и обработке данных на территории РФ, что особенно важно для клиентов из юридической сферы.

Для дальнейшего развития продукта Agentic Lab требовалась облачная платформа, которая обеспечит доступ к современным GPU-ресурсам, позволит быстро масштабировать вычислительные мощности по мере роста нагрузки и исключит необходимость инвестировать в собственную инфраструктуру.

Почему Cloud.ru

Ключевым фактором выбора Cloud.ru стала возможность использовать GPU-ресурсы по модели pay-as-you-go (по мере потребления). Такой подход позволяет Agentic Lab гибко масштабировать вычислительные мощности: запускать модели только при поступлении запросов и не платить за простаивающие ресурсы.

Дополнительными преимуществами стали:

  • доступ к высокопроизводительным GPU для задач генеративного ИИ;
  • возможность быстро масштабировать вычислительные мощности;
  • соответствие требованиям российского законодательства по работе с данными (соответствие требованиям 152-ФЗ и требованиям ФСТЭК России в области защиты информации);
  • единая экосистема сервисов для развития ИИ-продуктов.
Для нас было важно выбрать облачную платформу, которая позволит быстро запускать и масштабировать ИИ-продукты без необходимости инвестировать в собственную GPU-инфраструктуру. Благодаря сервисам Cloud.ru мы можем гибко наращивать вычислительные мощности по мере роста нагрузки, оплачивать только фактически потребленные ресурсы и соблюдать требования к безопасности и хранению данных. Это позволяет нам сосредоточиться на развитии продукта и запуске новых ИИ-сервисов для клиентов. Владимир Макаров CTO Agentic Lab

Решение

ИИ-помощник «Агата» развернут на базе сервисов Cloud.ru. Для работы языковых моделей Agentic Lab выбрала сервис Evolution ML Inference с моделью оплаты рay-as-you-go. Решение работает на разделяемых GPU-ресурсах (Shared GPU), которые автоматически выделяются в зависимости от текущей нагрузки. Такой подход позволяет гибко масштабировать вычислительные мощности и оптимизировать затраты за счет оплаты только фактически потребленных ресурсов.

Для решения различных задач используются две ключевых модели:

  • Mistral отвечает за извлечение метаданных, выделение сущностей и структурирование документов;
  • Gemma обеспечивает интеллектуальный поиск, суммаризацию материалов и работу диалогового интерфейса.

Бизнес-логика приложения, а также фронтенд и бэкенд размещены в сервисе Evolution Compute.

После загрузки документов, сканов и фотографий система автоматически обрабатывает содержимое файлов: распознает текст, извлекает ключевые сущности и метаданные, определяет участников и события и формирует единую базу знаний. На ее основе пользователи могут выполнять поиск на естественном языке, строить хронологию событий по делу и получать ответы со ссылками на первоисточники.

В результате специалисты работают через единый интерфейс вместо разрозненных архивов и файловых хранилищ, быстрее находят нужные документы и получают структурированную информацию по делу.

Результаты

Переход на инфраструктуру Cloud.ru позволил Agentic Lab повысить гибкость вычислительных ресурсов, ускорить работу ИИ-сервисов и снизить стоимость их масштабирования. Вот ключевые результаты внедрения: 

  • Масштабирование инфраструктуры за 5-10 минут. При росте нагрузки компания может оперативно подключать дополнительные GPU-ресурсы. При использовании выделенной инфраструктуры аналогичный процесс обычно занимает от одного до двух дней.
  • Отсутствие капитальных затрат на GPU-инфраструктуру. Компания использует модель оплаты по мере потребления вместо закупки собственного оборудования стоимостью в несколько миллионов рублей за GPU-карту.
  • Сокращение времени анализа документов. После обработки документов система автоматически формирует хронологию событий по делу, помогая быстрее работать с большими массивами информации. Скорость обработки зависит от количества и объема документов.
  • Автоматизация рутинных операций. ИИ-помощник берет на себя часть административной и документарной работы, позволяя юристам выполнять такие задачи примерно в два раза быстрее.
  • Стабильная производительность под нагрузкой. Среднее время ответа ИИ-помощника составляет около 15-20 секунд.
Сегодня скорость запуска и масштабирования ИИ-сервисов напрямую влияет на эффективность бизнеса. Проект Agentic Lab показывает, как облачная инфраструктура ускоряет развитие ИИ-продуктов, обеспечивает гибкое масштабирование вычислительных ресурсов под задачи и снижает нагрузку на инфраструктурные операции, позволяя командам быстрее развивать и улучшать сервисы. Кирилл Ляпин Руководитель направления по развитию клиентов Cloud.ru

Планы развития

В дальнейшем Agentic Lab планирует масштабировать ИИ-платформу «Агата», наращивая нагрузку и развивая новые сценарии интеллектуальной работы с документами на базе сервисов Cloud.ru.

В ближайших планах:

  • масштабирование продукта «Агата» на новые категории клиентов;
  • увеличение потребления GPU-ресурсов по мере роста пользовательской базы;
  • перенос дополнительных компонентов инфраструктуры в Cloud.ru;
  • запуск новых ИИ-продуктов на базе Evolution ML Inference;
  • консолидация инфраструктуры в Cloud.ru, включая перенос базы данных PostgreSQL и других компонентов платформы;
  • развитие функциональности «Агаты», включая генерацию процессуальных документов и интеграцию с нормативно-правовыми базами.

Запросите бесплатную консультацию по вашему проекту

Cloud