yandex

Cloud.ru и AI: как мы поддержали выход Wildberries на новый рынок

Дарим до 20 000 бонусов
для юрлиц и ИП
Подробнее
Avatar icon

Марина Суворова

Главный редактор блога

Статья

Время чтения

3 минуты

Маркетплейсы используют большие языковые модели (LLM) и генеративный AI в самых разных сценариях: от автоматизации рутинных операций, например, перевод карточек товаров на иностранные языки, до сложных аналитических задач. В этом кейсе рассказываем, как технологии искусственного интеллекта в облаке помогли Wildberries подготовиться к выходу на рынок Грузии.

Wildberries — самый крупный по обороту маркетплейс в России. Доставляет заказы в несколько стран, в том числе Беларусь, Казахстан и Армению. В октябре 2024 года маркетплейс запустил продажи в Грузии. Перед выходом на новый рынок Wildberries предстояло быстро реализовать несколько важных проектов:

●      автоматизировать перевод карточек товаров на грузинский

и английский языки;

●      дообучить и запустить русскоязычную LLM на закрытом GPU-кластере;

●      разработать классификатор товаров по кодам ТН ВЭД;

●      протестировать собственную гипотезу и построить прогноз.

Почему он сделал это в облаке

AI-технологии требуют постоянно обучать языковые модели и проверять их качество. Для этого компании нужны ресурсы, особенно графические процессоры (GPU), объединенные в кластеры так, чтобы параллельно, а значит быстрее, обучать одну языковую модель.

Арендовать инфраструктуру с GPU выгодней, чем покупать и содержать ее самостоятельно. Одно из решений — обратиться к облачному провайдеру, который предоставляет вычислительные мощности и ML-сервисы с разными моделями и конфигурациями графических процессоров. Кроме возможности выбора GPU, у клиента в облаке есть и финансовое преимущество: ему не нужны большие начальные инвестиции в аппаратное обеспечение, при этом платить он будет только за используемые ресурсы.

Какие задачи решил маркетплейс

Wildberries обучал свои языковые модели на GPU в облаке Cloud.ru. Так он оптимизировал финансовые затраты, в несколько раз быстрее реализовал запланированные проекты, а его IT-команда получила инструмент, чтобы решать сразу несколько задач.

Перевел карточки товаров с отзывами на грузинский и английский языки

Задача перевести карточки товаров на другой язык в теории тривиальная, а на практике нет. Сложность была в том, что грузинский язык распространен не так как английский, а у карточек товаров есть особенности в стилистике и терминологии.

Wildberries переводил карточки с помощью LLM, но сначала модель дообучили на специфическом корпусе текстов. Альтернативой большой языковой модели мог бы стать готовый сторонний сервис, но по расчетам он обошелся бы дороже, особенно если учитывать также перевод отзывов о товарах. А собственная дообученная языковая модель позволила сократить затраты и повысить качество перевода.

Дообучил и запустил русскоязычную большую языковую модель

Большая языковая модель может провести автоматическую разметку данных для обучения более простых моделей. Такой сценарий подходит, например, для классификатора кодов товарной номенклатуры внешнеэкономической деятельности (ТН ВЭД). Маркетплейс разработал классификатор кодов с помощью LLM, доступ к которой предоставил Cloud.ru — это ускорило процесс и повысило точность моделей.

Автоматизировал выбор кода ТН ВЭД

Товар, который отправляется за границу, должен иметь таможенный код. Часто продавцы ошибаются: указывают неверный код и из-за этого рискуют получить штраф и нереализованный товар.

Wildberries автоматизировал выбор таможенного кода, используя языковую модель. Сначала с помощью LLM он сформировал обучающую выборку и провел инференс модели на мощных GPU в облаке. На базе этой выборки построил более простую модель, которая работает уже на обычных процессорах (CPU). Эта модель определяет код ТН ВЭД по описанию в карточке товара.

Оптимизировал тестирование гипотез и построение прогнозов

Команде дата-сайентистов нужен большой объем ресурсов, чтобы проверять гипотезы и строить прогнозы. Они используют облачные решения Cloud.ru, чтобы подтвердить или опровергнуть свои предположения. Выгода в том, что облачный провайдер оперативно выделяет необходимые вычислительные мощности и маркетплейсу не нужно закупать дополнительное оборудование.

Что получилось в итоге

Wildberries оперативно получил эластичную инфраструктуру, что стало ключевым фактором в оперативном решении бизнес-задач. Компания смогла быстрее выйти на новый рынок и в несколько раз снизить затраты на подготовку благодаря использованию облачных мощностей с GPU. Гибкость и сокращенный time to market — основные результаты сотрудничества Wildberries и Cloud.ru.

Оценивая эффект от оптимизации с помощью GPU, мы отслеживаем влияние на показатель общего объема оборота товаров, или GMV, просчитывая его в случае каждой решаемой задачи. Такого рода метрики — часть KPI нашей ML-команды. Если говорить о GPU-ресурсах, то сотрудничество с лидирующим облачным провайдером Cloud.ru помогает нам сделать так, чтобы ML-команда могла эффективно реализовать сразу несколько приоритетных проектов и сбалансированно подойти к распределению нагрузки, используя и собственные ресурсы, и сторонние.

Николай Устиновруководитель ML-команды в Wildberries

Наш пилотный проект наглядно демонстрирует, как облачные услуги помогают в развитии бизнеса крупнейшему российскому маркетплейсу. Изначально придерживаясь стратегии in-house first в построении IT-инфраструктуры, Wildberries в отдельных случаях использует внешние GPU-ресурсы. В условиях быстро меняющегося рынка и растущих требований к вычислительным мощностям в компании приняли решение выйти за рамки данной стратегии. В постоянном контакте с командой клиента мы подбираем оптимальные облачные и AI-решения, которые помогают маркетплейсу адаптироваться к рыночным вызовам, реализовывать инновационный потенциал и конкурировать с ведущими мировыми eCom-компаниями. Сотрудничество Wildberries и Cloud.ru закладывает фундамент для будущих проектов, результаты которых охватят десятки миллионов пользователей

Родион Будченкоруководитель направления «Ритейл» в Cloud.ru

Содержание

  • Почему он сделал это в облаке
  • Какие задачи решил маркетплейс
  • Что получилось в итоге

Вам может понравиться