yandex
Калькулятор ценТарифыАкцииДокументацияО насКарьера в Cloud.ruНовостиЮридические документыКонтактыРешенияРеферальная программаКейсыПартнерство с Cloud.ruБезопасностьEvolutionAdvancedEvolution StackОблако VMwareВ чем отличия платформ?БлогОбучение и сертификацияМероприятияИсследования Cloud.ruЛичный кабинетВойтиЗарегистрироватьсяОблако для мобильных и веб‑приложенийСайт в облакеАналитика данных в облакеХранение данных в облакеАналитика данных в облакеИнфраструктура для 1С в облакеМиграция IT‑инфраструктуры в облако3D-моделирование и рендерингРазработка и тестирование в облакеEvolution ComputeEvolution Managed KubernetesEvolution Object StorageEvolution Managed PostgreSQL®Evolution Bare MetalEvolution SSH KeysEvolution ImageEvolution DNSEvolution VPCEvolution Load BalancerEvolution Magic RouterEvolution DiskEvolution Container AppsEvolution Artifact RegistryEvolution Managed ArenadataDBEvolution Managed TrinoEvolution Managed SparkEvolution ML InferenceEvolution Distributed TrainEvolution ML FinetuningEvolution NotebooksEvolution TagsEvolution Task HistoryCurator Anti-DDoSCurator Anti‑DDoS+WAFUserGate: виртуальный NGFWStormWall: Anti-DDoSCloud MonitoringCloud LoggingАренда GPUDirect ConnectCDNCloud AdvisorCross-platform connectionAdvanced Object Storage ServiceAdvanced Elastic Cloud ServerAdvanced Relational Database Service for PostgreSQLAdvanced Image Management ServiceAdvanced Auto ScalingAdvanced Enterprise RouterAdvanced Cloud Backup and RecoveryAdvanced Data Warehouse ServiceAdvanced Elastic Volume ServiceAdvanced Cloud Container EngineAdvanced FunctionGraphAdvanced Container Guard ServiceAdvanced Software Repository for ContainerAdvanced Document Database Service with MongoDBAdvanced Relational Database Service for MySQLAdvanced Relational Database Service for SQL ServerAdvanced Server Migration ServiceAdvanced Data Replication ServiceAdvanced API GatewayAdvanced CodeArtsAdvanced Distributed Message Service for KafkaAdvanced Distributed Message Service for RabbitMQAdvanced DataArts InsightAdvanced CloudTableAdvanced MapReduce ServiceAdvanced Cloud Trace ServiceAdvanced Application Performance ManagementAdvanced Identity and Access ManagementAdvanced Enterprise Project Management ServiceVMware: виртуальный ЦОД с GPUVMware: виртуальный ЦОДУдаленные рабочие столы (VDI)VMware: резервное копирование виртуальных машинVMware: резервный ЦОДVMware: резервное копирование в облакоVMware: миграция виртуальных машин
Связаться с нами
IT-разработка

Разработчик «Жива Технологии» развернул приложение с AI-ассистентом в облаке Cloud.ru

Компания арендует виртуальные машины с GPU А-100 для тестовой и продовой среды

Результат

инфографика

О компании

«Жива Технологии» — разработчик приложения JIVA, ассистента для поддержки здорового образа жизни. Приложение совмещает в себе консультанта по питанию и фитнесу: рассчитывает необходимый организму объем воды, разрабатывает индивидуальный фитнес-план, фиксирует ошибки во время выполнения упражнений и формирует шаги, чтобы пользователь мог достичь поставленной цели.

JIVA выполняет роль персонального фитнес-тренера. Но в отличие от других программ и приложений по ЗОЖ, роль реального куратора, закрепленного за пользователем, выполняет искусственный интеллект. Пользователю достаточно загрузить фото блюда, и алгоритм приложения сам рассчитает вес порции, содержание макро- и микро-нутриентов, баланс КБЖУ и даст рекомендации, какие ингредиенты стоит заменить, чтобы соблюдать норму.

Задача

Ядро приложения JIVA — искусственный интеллект: модели для распознавания нутриентов по фото, встроенный AI-ассистент на базе LLM, а также каскад моделей по детекции и распознаванию физических упражнений, которые клиент собрал на open source. Для обучения и инференса этих моделей разработчику требовались видеокарты с GPU.

Специалисты «Жива Технологии» понимали, что покупать свои графические процессоры для такой задачи экономически невыгодно, поэтому решили использовать облачные мощности с графическими процессорами. Причем в облаке они планировали использовать не только виртуальные машины с GPU, но и другие сервисы, чтобы развернуть бэкенд приложения и сами модели, мониторить их работоспособность и управлять ресурсами в одном месте.

Почему Cloud.ru

От облака нам были нужны не только виртуальные машины с GPU, но и полный спектр сервисов для резервного копирования, мониторинга и логирования работы всей нашей инфраструктуры, чтобы промышленная среда была всегда доступна и приложение работало корректно. Данил Сметанев Генеральный директор, «Жива Технологии» Мы смогли удовлетворить ожидания и предоставили графические процессоры тех конфигураций, которые требовались клиенту для обучения и инференса AI-моделей в облаке. Никита Пивоваров Менеджер по развитию ключевых клиентов, Cloud.ru

Решение

Бэкенд приложения и AI-модель для подбора физических упражнений клиент развернул на пяти виртуальных машинах Advanced Elastic Cloud Server на платформе Cloud.ru Advanced. Там же подключил сервисы для мониторинга, логирования и работы с базами данных:

  • Advanced Log Tank Service — сервис для сбора логов с хостов и облачных сервисов для централизованного управления и анализа больших объемов логов в реальном времени,
  • Advanced Elastic Load Balance — облачный балансировщик нагрузки автоматически распределяет входящий трафик между множеством серверов,
  • Advanced Object Storage — сервис хранения и управления объектным хранилищем данных,
  • Advanced Cloud Backup and Recovery — сервис для резервного копирования и восстановления данных,
  • Advanced Distributed Cache Service for Redis — высокопроизводительный распределенный сервис кеширования данных в оперативной памяти,
  • Advanced Application Operation Management (AOM) — универсальная платформа управления O&M, которая позволяет пользователю контролировать свои приложения и отслеживать изменения их производительности и ресурсов в реальном времени,
  • Advanced Relational Database Service for PostgreSQL — сервис управления базами данных с комплексным мониторингом производительности, многоуровневой системой безопасности и поддержкой PostgreSQL.
Готовые сервисы мониторинга и логирования удобны тем, что не требуют вложения времени и компетенций в настройку и администрирование: пользователь выбирает подходящий сервис и сразу начинает им пользоваться. Никита Пивоваров Менеджер по развитию ключевых клиентов, Cloud.ru

Для большой языковой модели разработчик выбрал две платформы: Cloud.ru Evolution для тестовой среды и дообучения модели и Cloud.ru Advanced для продовой среды и инференса модели. Соединил платформы между собой зашифрованным каналом связи через интернет

Тестовую среду клиент развернул на виртуальных машинах Evolution Compute c GPU с гарантированной долей vCPU 30% 8vCPU 16GB RAM. Для тестирования использовал одну GPU-карту A100 — она позволяет проводить эксперименты по улучшению и тестированию LLM-моделей. Также подключил объектное хранилище Evolution Object Storage для сбора данных, на которых точечно дообучается модель, и хранения бенчмарков, по которым проверяется работоспособность LLM.

Продовую среду разработчик развернул на виртуальных машинах на платформе Cloud.ru Advanced с такими характеристиками: 20 vCPU 117 GB RAM 1 x A100 NVIDIA 80 GB.

Результат

У нас уже был опыт развертывания облачных сервисов и моделей искусственного интеллекта, поэтому в большинстве ситуаций помощь нам была не нужна. Вопросы появлялись, когда подключали сервисы платформы Cloud.ru Evolution, с которыми мы раньше не работали. И здесь нам помогала техническая документация к сервисам и ответы инженеров поддержки. Вообще мы были одними из первых пользователей платформы Cloud.ru Evolution. Данил Сметанев Генеральный директор, «Жива Технологии» Как провайдер мы можем предоставить полный набор сервисов для работы с AI-моделями и AI-агентами. В каталоге Cloud.ru есть целая цифровая среда Evolution AI-factory, чтобы создавать, запускать и масштабировать приложения на базе GenAI. Никита Пивоваров Менеджер по развитию ключевых клиентов, Cloud.ru

Планы

Скорость работы LLM-модели для нас приоритет. Пока модель распознает нутриенты по фото за 8-10 секунд, мы стремимся сократить время до 2-3 секунд. И нам важно повышать скорость, не арендуя при этом дополнительные GPU и не увеличивая затраты на дообучение моделей. Данил Сметанев Генеральный директор, «Жива Технологии» Мы предложили клиенту протестировать новый сервис для запуска и развертывания моделей машинного и глубокого обучения — Evolution ML Inference. Это готовый сервис c гибкой тарификацией за счет того, что пользователь приобретает не целиком весь графический процессор, а ровно столько его мощности, сколько нужно модели. Evolution ML Inference помогает в экономии ресурсов и оптимизации затрат на облако. Никита Пивоваров Менеджер по развитию ключевых клиентов, Cloud.ru

Запросите бесплатную консультацию по вашему проекту

Cloud