
Cloud.ru и AI: как мы поддержали выход Wildberries на новый рынок
Статья
Время чтения
3 минуты
Маркетплейсы используют большие языковые модели (LLM) и генеративный AI в самых разных сценариях: от автоматизации рутинных операций, например, перевод карточек товаров на иностранные языки, до сложных аналитических задач. В этом кейсе рассказываем, как технологии искусственного интеллекта в облаке помогли Wildberries подготовиться к выходу на рынок Грузии.
Wildberries — самый крупный по обороту маркетплейс в России. Доставляет заказы в несколько стран, в том числе Беларусь, Казахстан и Армению. В октябре 2024 года маркетплейс запустил продажи в Грузии. Перед выходом на новый рынок Wildberries предстояло быстро реализовать несколько важных проектов:
● автоматизировать перевод карточек товаров на грузинский
и английский языки;
● дообучить и запустить русскоязычную LLM на закрытом GPU-кластере;
● разработать классификатор товаров по кодам ТН ВЭД;
● протестировать собственную гипотезу и построить прогноз.
Почему он сделал это в облаке
AI-технологии требуют постоянно обучать языковые модели и проверять их качество. Для этого компании нужны ресурсы, особенно графические процессоры (GPU), объединенные в кластеры так, чтобы параллельно, а значит быстрее, обучать одну языковую модель.
Арендовать инфраструктуру с GPU выгодней, чем покупать и содержать ее самостоятельно. Одно из решений — обратиться к облачному провайдеру, который предоставляет вычислительные мощности и ML-сервисы с разными моделями и конфигурациями графических процессоров. Кроме возможности выбора GPU, у клиента в облаке есть и финансовое преимущество: ему не нужны большие начальные инвестиции в аппаратное обеспечение, при этом платить он будет только за используемые ресурсы.
Какие задачи решил маркетплейс
Wildberries обучал свои языковые модели на GPU в облаке Cloud.ru. Так он оптимизировал финансовые затраты, в несколько раз быстрее реализовал запланированные проекты, а его IT-команда получила инструмент, чтобы решать сразу несколько задач.
Перевел карточки товаров с отзывами на грузинский и английский языки
Задача перевести карточки товаров на другой язык в теории тривиальная, а на практике нет. Сложность была в том, что грузинский язык распространен не так как английский, а у карточек товаров есть особенности в стилистике и терминологии.
Wildberries переводил карточки с помощью LLM, но сначала модель дообучили на специфическом корпусе текстов. Альтернативой большой языковой модели мог бы стать готовый сторонний сервис, но по расчетам он обошелся бы дороже, особенно если учитывать также перевод отзывов о товарах. А собственная дообученная языковая модель позволила сократить затраты и повысить качество перевода.
Дообучил и запустил русскоязычную большую языковую модель
Большая языковая модель может провести автоматическую разметку данных для обучения более простых моделей. Такой сценарий подходит, например, для классификатора кодов товарной номенклатуры внешнеэкономической деятельности (ТН ВЭД). Маркетплейс разработал классификатор кодов с помощью LLM, доступ к которой предоставил Cloud.ru — это ускорило процесс и повысило точность моделей.
Автоматизировал выбор кода ТН ВЭД
Товар, который отправляется за границу, должен иметь таможенный код. Часто продавцы ошибаются: указывают неверный код и из-за этого рискуют получить штраф и нереализованный товар.
Wildberries автоматизировал выбор таможенного кода, используя языковую модель. Сначала с помощью LLM он сформировал обучающую выборку и провел инференс модели на мощных GPU в облаке. На базе этой выборки построил более простую модель, которая работает уже на обычных процессорах (CPU). Эта модель определяет код ТН ВЭД по описанию в карточке товара.
Оптимизировал тестирование гипотез и построение прогнозов
Команде дата-сайентистов нужен большой объем ресурсов, чтобы проверять гипотезы и строить прогнозы. Они используют облачные решения Cloud.ru, чтобы подтвердить или опровергнуть свои предположения. Выгода в том, что облачный провайдер оперативно выделяет необходимые вычислительные мощности и маркетплейсу не нужно закупать дополнительное оборудование.
Что получилось в итоге
Wildberries оперативно получил эластичную инфраструктуру, что стало ключевым фактором в оперативном решении бизнес-задач. Компания смогла быстрее выйти на новый рынок и в несколько раз снизить затраты на подготовку благодаря использованию облачных мощностей с GPU. Гибкость и сокращенный time to market — основные результаты сотрудничества Wildberries и Cloud.ru.
Оценивая эффект от оптимизации с помощью GPU, мы отслеживаем влияние на показатель общего объема оборота товаров, или GMV, просчитывая его в случае каждой решаемой задачи. Такого рода метрики — часть KPI нашей ML-команды. Если говорить о GPU-ресурсах, то сотрудничество с лидирующим облачным провайдером Cloud.ru помогает нам сделать так, чтобы ML-команда могла эффективно реализовать сразу несколько приоритетных проектов и сбалансированно подойти к распределению нагрузки, используя и собственные ресурсы, и сторонние.
Наш пилотный проект наглядно демонстрирует, как облачные услуги помогают в развитии бизнеса крупнейшему российскому маркетплейсу. Изначально придерживаясь стратегии in-house first в построении IT-инфраструктуры, Wildberries в отдельных случаях использует внешние GPU-ресурсы. В условиях быстро меняющегося рынка и растущих требований к вычислительным мощностям в компании приняли решение выйти за рамки данной стратегии. В постоянном контакте с командой клиента мы подбираем оптимальные облачные и AI-решения, которые помогают маркетплейсу адаптироваться к рыночным вызовам, реализовывать инновационный потенциал и конкурировать с ведущими мировыми eCom-компаниями. Сотрудничество Wildberries и Cloud.ru закладывает фундамент для будущих проектов, результаты которых охватят десятки миллионов пользователей
Вам может понравиться


Какие новости за февраль и март — дайджест Cloud.ru

INSERT INTO SQL: примеры добавления данных в таблицу

Node.js на Ubuntu 24.04: как установить и настроить

Что такое HTTPS и как он защищает ваши данные

REST API: что это и как использовать

Как создать Telegram Web App: инструкция по разработке Mini App

Как привлекать клиентов и зарабатывать до 20% на рекомендациях: готовые инструменты

Коды ошибок HTTP: что нужно знать о серверных и клиентских ошибках

Лучшие дистрибутивы Linux: выбор популярных версий

Система управления базами данных (СУБД): что это такое и зачем нужна

Все о Telegram-ботах: какие бывают и как их сделать самому

VPS/VDS: что это такое и чем они отличаются? Полное руководство

Что такое NVMe и как он отличается от SATA SSD и M.2

Микросервисная архитектура: чем она хороша и кому нужна

Как развернуть WordPress в облаке: инструкция для новичков

Применение LLM в бизнесе: опыт лидеров и роль облачного провайдера

Центры обработки данных (ЦОД): что это и как они работают

Какие новости за январь — дайджест Cloud.ru

Команда grep в Linux: как искать строки и шаблоны

PostgreSQL: что это за СУБД и чем она хороша

Что может chmod: как управлять доступами к файлам и папкам в Linux

Как узнать IP-адрес в Linux через командную строку

Как узнать IP-адрес своего компьютера

Система MySQL: что это и для чего нужна

Команды kill и killall в Linux: как завершить ненужные процессы

Работа с файлами в Linux: их создание и организация через терминал

Стандарт Tier III для дата-центра: что значит и почему это круто

Какие новости за декабрь и начало января — дайджест Cloud.ru

Что такое FTP-протокол и как настроить FTP сервер

Белые и серые IP, динамические и статические - в чем различие

Как защищать сайты и приложения в облаке от DDoS-атак

Какие новости за ноябрь — дайджест Cloud.ru

BAT-файлы: что это такое, зачем они нужны и как их создавать

Гайд по протоколу HTTP: расшифровка, структура и механизм работы

Межсетевой экран, firewall и брандмауэр: что это, в чем между ними разница и зачем они нужны

Kubernetes на Cloud.ru Evolution: возможности и преимущества

Какие новости за октябрь — дайджест Cloud.ru

Как создать сетевую архитектуру для размещения межсетевых экранов на платформе Облако VMware

Рассказать про технологии лампово, или Как мы провели конференцию GoCloud Tech для инженеров и...

Какие новости за сентябрь — дайджест Cloud.ru

Высокоресурсные вычисления: роль суперкомпьютеров в жизни и бизнесе

Реферальная программа Cloud.ru: как устроена и как на ней зарабатывать

Сетевая модель OSI: что это такое и зачем она нужна

Какие новости за август — дайджест Cloud.ru

Сетевые протоколы передачи данных — что это такое и какие бывают

Какие новости за июль — дайджест Cloud.ru

Как новые возможности в юридических документах Cloud.ru облегчают работу с договорами и не только

Какие новости за июнь — дайджест Cloud.ru

Как обновления VMware Cloud Director облегчают управление и делают работу с инфраструктурой в ...

Как мы рассчитывали «Панораму российского IT-рынка» за 2022 год

Как снизить риски утечки данных и санкций госрегуляторов: 152-ФЗ в Cloud.ru

Бесплатный курс по работе с Cloud.ru Advanced: рассказываем, в чем польза, кому подойдет и как...

Как модель Anything as a Service упрощает IT-процессы

Снижение рисков на производстве: AI-сервис распознает нарушения ношения СИЗ

Kandinsky 2.1: новый уровень в генерации изображений по текстовому описанию

Облачные сервисы для стартапов: как пройти путь от идеи до цифрового продукта и не разориться

Создать пользователя, настроить 2FA, связаться с поддержкой — новые возможности личного кабине...

VDI: что это, как работает и в чем выгода для бизнеса

Как защитить облачную инфраструктуру — рассказываем на примере межсетевого экрана нового покол...

Как начать использовать AI/ML на практике

Бессерверные вычисления: что это за технология и кому она нужна

Чек-лист: как обеспечить безопасность облачной инфраструктуры

Искусственный интеллект

Что такое IaaS?

Что такое PaaS

Machine Learning

Data Science

Машинное обучение без учителя

Классическое машинное обучение

Нейронные сети

Глубокое обучение

Защита персональных данных: как легче соблюдать закон с Cloud.ru и сохранять спокойствие

Как сохранить IT-инфраструктуру и бизнес: руководство к действию

Машинное обучение и Big Data в кибербезопасности

Ответы на актуальные вопросы

Что такое DDoS-атаки, чем они опасны и как от них защититься

Аудит информационной безопасности: что это, зачем и когда его проводить

Межсетевые экраны: UTM, NGFW-системы, NTA, NDR

Обзор межсетевых экранов, систем IPS и IDS

PostgreSQL vs MySQL: какая система подходит вашему бизнесу

Основы резервного копирования

Специальное предложение «180 дней тестового периода резервного копирования» для всех клиентов
Платформа SberCloud Advanced теперь обеспечивает максимальный уровень защиты персональных данных

Что такое объектное хранилище S3 и как его используют

Customer Enablement: как SberCloud работает с клиентами, чтобы сделать миграцию в облако комфо...

Сеть доставки контента CDN: новые функциональные возможности и преимущества

Объясняем на кейсах: польза CDN для бизнеса

Новая Windows Server 2022 в облаке SberCloud — новые возможности клиентов

Запуск нового сервиса Managed OpenShift в облачной среде SberCloud

Как работает технология DNS

SberCloud Advanced запустила третью ресурсную зону доступности для комфортной работы клиентов

PostGIS в PostgreSQL — как можно использовать

GitLab для начинающих: как и для чего используется

Краткий обзор методологии CI/CD: принципы, этапы, плюсы и минусы

Персональные данные: правильно обрабатываем и храним

Кто и зачем использует облачные модели IaaS и PaaS

152-ФЗ в облаке: хранение персональных данных в облаке

Как работает CDN (Content Delivery Network)?

Service Level Agreement (SLA): все о соглашении об уровне сервиса

Что такое «интернет поведения» (IoB)?

Чек-лист: 6 шагов для успешной миграции в облако

Машинное обучение: просто о сложном

Профессия DevOps-инженер: кто это и чем занимается

Гайд по Kubernetes. Эпизод I: k8s для неразработчиков

Публичные, частные и гибридные облака: в чем разница?
