
Применение LLM в бизнесе: опыт лидеров и роль облачного провайдера
Статья
Время чтения
4 минуты
В последние годы вокруг искусственного интеллекта много разговоров и дискуссий, ведь мы достигли тех вычислительных возможностей, которые позволяют применять AI в повседневной работе. Как облачный провайдер мы часто общаемся с компаниями, которые внедряют большие языковые модели в бизнес-процессы. Кто-то делает первые шаги в мире искусственного интеллекта, а кто-то уже строит свои LLM-платформы, запускает AI-ассистентов и агентов и замечает значительный экономический эффект от его использования.
Мы поговорили с лидерами рынка, которые уже активно используют AI и обучают свои модели. В этой статье делимся нашими наблюдениями и опытом использования облака для ML и LLM.

Как применять LLM в задачах бизнеса
Современные LLM открывают новые горизонты для бизнеса, трансформируя традиционные процессы и подходы. В следующих пунктах рассмотрим несколько самых популярных сценариев применения LLM в бизнесе, которые мы заметили в крупных российских компаниях.
Генеративный поиск и анализ большого объема информации
Своевременно полученная информация — ключ к лидерству на рынке. Поэтому для нас важно анализировать публикации по теме развития технологий и сервиса в авиации, выделять новости и тренды. С помощью LLM мы извлекаем данные, приводим их к единому языку, выстраиваем иерархию по кластерам, выявляем тренды, визуализируем и формируем отчет. Это позволяет непрерывно и результативно мониторить большие объемы информации, быстро проверять гипотезы и получать экономический эффект.
Формирование названий и описаний товаров и услуг
Первый продуктовый сценарий, который мы внедрили — это генерация описания товара. Это важное поле, потому что описание попадает в поисковый индекс и, если продавец подробно опишет свой товар, то покупателю будет проще его найти. Мы сделали модель, которая по фотографии товара, параметрам и заголовку может сгенерировать описание этого товара. После A/B-тестирования увидели uplift заказов с доставкой на 1,7% и 60% пользователей отвечали, что им понравилось сгенерированное описание.
Суммаризация отзывов
В Авито в некоторых категориях на продавца очень много отзывов, например, в категории “услуги”: сотни или даже тысячи. Мы обучили модель, которая суммаризирует эти отзывы, выделяет в единый текст достоинства и недостатки. Сейчас это работает в А/Б-тестировании, но мы уже видим положительный эффект.
Внутренние ассистенты (CoPilot)
CoPilot — это веб-ассистент для решения разных бизнес-задач на базе генеративного искусственного интеллекта. Изначально перед ассистентом мы ставили две цели: повышение эффективности и демократизация AI во внутренней культуре. Ежемесячно наш сервис используют 2 253 сотрудника. Он помогает генерировать и анализировать тексты и изображения, помогает при работе с кодом и даже при работе с Excel. Также мы предлагаем нашим коллегам AI Self-Service: пользователь может самостоятельно загрузить данные или составить свой промт, которым хочет поделиться с коллегами. Параллельно с этим мы начали внедрение маскирования данных, чтобы запросы к ассистенту не несли в себе коммерческую тайну или персональные данные.
Осенью 2023 года у нас появились AI-помощники, которые помогают сгенерировать текст, суммаризировать и перефразировать информацию, пояснить или написать код для разработчиков, а еще анализировать новостной фон: есть ли негативные или нейтральные новости, сообщения о наших контрагентах, и делать по таким новостям репорты.
AI-агенты
Как отдельный тренд мы выделяем развитие и применение агентов. Ассистенты, о которых мы говорили выше, больше ориентированы на поддержку пользователей, тогда как агенты зачастую действуют самостоятельно в сложной среде. Например, вы можете направить агента на создание виртуальных машин, баз данных или развертывания небольшого интернет-магазина в облаке.

Для этого нужна большая LLM-платформа, где выстраивается система агентов, которые решают свои доменные задачи и полностью автоматизируют процессы внутри компании.
Что нужно компании для внедрения LLM
Обучение и инференс, создание компонентов для полноценной LLM-платформы требуют не только надежной инфраструктуры, но и соответствующих компетенций. Здесь надежным партнером может стать облачный провайдер, предоставляя инфраструктуру, сервисы и опытную команду.
Инфраструктура для инференса и обучения
LLM нуждаются в мощных вычислительных кластерах с использованием GPU. Cloud.ru предоставляет такие ресурсы, позволяя эффективно обрабатывать большие объемы данных. Это ускоряет обучение и запуск моделей и позволяет быстрее получать результаты. Такие ресурсы проще арендовать, чем закупить.
Обучение и инференс — это командная работа, поэтому помимо мощной инфраструктуры нужна мощная команда: начиная от разработчиков самой модели — дата-сайентистов, заканчивая теми, кто будет дорабатывать и выводить модель в продакшн — ML-инженеров.
Готовые сервисы
Использовать облачные managed-решения не только экономически выгодно, но еще и удобно, так как пользователь получает набор предзаготовленных инструментов почти под любую задачу. Это сокращает время работы специалиста с рутинными или не профильными задачами, например, подготовкой образа для обучения или запуска ML- и DL-модели.
Мы предлагаем инструменты, которые облегчают вывод модели в продакшн. Среди них Evolution ML Inference, который позволяет эффективно распределять видеопамять GPU на одну большую или сразу несколько небольших моделей. Так, например, нет необходимости брать целый GPU, если модель полностью не утилизирует vRAM (видеопамять) карты или чипа. Это решение создает баланс стоимости, производительности и эффективности запуска и эксплуатации моделей.
Надежность
Мы как провайдер берем на себя вопросы безопасности, обновлений и отказоустойчивости систем. Это освобождает клиентов от технических забот, позволяя им сосредоточиться на развитии новых фич и решении основных бизнес-задач.
Таким образом, сотрудничество с облачным провайдером позволяет компаниям использовать передовые технологии без дополнительных затрат и сложностей, связанных с их внедрением и поддержкой, концентрируя усилия на инновациях и развитии.
Насколько безопасно и этично использовать LLM для бизнес-задач
Работа с большими языковыми моделями требует особого внимания к вопросам безопасности, особенно когда дело касается обработки чувствительных данных. И здесь есть несколько подходов.
Развертывание отдельного инстанса
Предполагает создание отдельного экземпляра LLM в облаке с использованием выделенного канала связи. Это позволяет надежно обрабатывать персональные данные, обеспечивая защиту через шифрование на всех этапах передачи. Использование закрытых каналов минимизирует риски утечки и обеспечивает соответствие стандартам конфиденциальности.
Data masking
Этот метод включает в себя изменение или скрытие оригинальных данных перед их обработкой моделью. Например, персональные данные могут быть заменены псевдонимами или иными эквивалентами, что позволяет модели выполнять задачи без доступа к конфиденциальной информации, при этом не теряя контекст.
Развертывание модели в собственном контуре
Компании могут развернуть LLM в собственной инфраструктуре. Это позволяет контролировать все аспекты доступа и обработки данных, снижать риски, связанные с внешними факторами, и обеспечивать полный контроль над средой исполнения LLM.

Этические аспекты работы с LLM также требуют внимания. Да, машины в состоянии решать многие задачи, но чаще всего результат требует проверки эксперта, так как у AI есть склонность к галлюцинациям. Поэтому многие компании смотрят в сторону развития полноценных LLM-платформ, где можно дообучать модели эффективнее и минимизировать количество ошибок. Однако, скорее всего, человеческое участие еще долгое время будет необходимо при решении бизнес-задач.
Заключение
С развитием искусственного интеллекта бизнес получил мощные инструменты для оптимизации и роста. Эти технологии открывают новые горизонты и их освоение обеспечивает конкурентное преимущество на рынке. А облачный провайдер выступает здесь как надежный партнер, который позволяет эффективно и безопасно внедрять инновации.
Вам может понравиться


Cloud.ru и AI: как мы поддержали выход Wildberries на новый рынок

Какие новости за февраль и март — дайджест Cloud.ru

INSERT INTO SQL: примеры добавления данных в таблицу

Node.js на Ubuntu 24.04: как установить и настроить

Что такое HTTPS и как он защищает ваши данные

REST API: что это и как использовать

Как создать Telegram Web App: инструкция по разработке Mini App

Как привлекать клиентов и зарабатывать до 20% на рекомендациях: готовые инструменты

Коды ошибок HTTP: что нужно знать о серверных и клиентских ошибках

Лучшие дистрибутивы Linux: выбор популярных версий

Система управления базами данных (СУБД): что это такое и зачем нужна

Все о Telegram-ботах: какие бывают и как их сделать самому

VPS/VDS: что это такое и чем они отличаются? Полное руководство

Что такое NVMe и как он отличается от SATA SSD и M.2

Микросервисная архитектура: чем она хороша и кому нужна

Как развернуть WordPress в облаке: инструкция для новичков

Центры обработки данных (ЦОД): что это и как они работают

Какие новости за январь — дайджест Cloud.ru

Команда grep в Linux: как искать строки и шаблоны

PostgreSQL: что это за СУБД и чем она хороша

Что может chmod: как управлять доступами к файлам и папкам в Linux

Как узнать IP-адрес в Linux через командную строку

Как узнать IP-адрес своего компьютера

Система MySQL: что это и для чего нужна

Команды kill и killall в Linux: как завершить ненужные процессы

Работа с файлами в Linux: их создание и организация через терминал

Стандарт Tier III для дата-центра: что значит и почему это круто

Какие новости за декабрь и начало января — дайджест Cloud.ru

Что такое FTP-протокол и как настроить FTP сервер

Белые и серые IP, динамические и статические - в чем различие

Как защищать сайты и приложения в облаке от DDoS-атак

Какие новости за ноябрь — дайджест Cloud.ru

BAT-файлы: что это такое, зачем они нужны и как их создавать

Гайд по протоколу HTTP: расшифровка, структура и механизм работы

Межсетевой экран, firewall и брандмауэр: что это, в чем между ними разница и зачем они нужны

Kubernetes на Cloud.ru Evolution: возможности и преимущества

Какие новости за октябрь — дайджест Cloud.ru

Как создать сетевую архитектуру для размещения межсетевых экранов на платформе Облако VMware

Рассказать про технологии лампово, или Как мы провели конференцию GoCloud Tech для инженеров и...

Какие новости за сентябрь — дайджест Cloud.ru

Высокоресурсные вычисления: роль суперкомпьютеров в жизни и бизнесе

Реферальная программа Cloud.ru: как устроена и как на ней зарабатывать

Сетевая модель OSI: что это такое и зачем она нужна

Какие новости за август — дайджест Cloud.ru

Сетевые протоколы передачи данных — что это такое и какие бывают

Какие новости за июль — дайджест Cloud.ru

Как новые возможности в юридических документах Cloud.ru облегчают работу с договорами и не только

Какие новости за июнь — дайджест Cloud.ru

Как обновления VMware Cloud Director облегчают управление и делают работу с инфраструктурой в ...

Как мы рассчитывали «Панораму российского IT-рынка» за 2022 год

Как снизить риски утечки данных и санкций госрегуляторов: 152-ФЗ в Cloud.ru

Бесплатный курс по работе с Cloud.ru Advanced: рассказываем, в чем польза, кому подойдет и как...

Как модель Anything as a Service упрощает IT-процессы

Снижение рисков на производстве: AI-сервис распознает нарушения ношения СИЗ

Kandinsky 2.1: новый уровень в генерации изображений по текстовому описанию

Облачные сервисы для стартапов: как пройти путь от идеи до цифрового продукта и не разориться

Создать пользователя, настроить 2FA, связаться с поддержкой — новые возможности личного кабине...

VDI: что это, как работает и в чем выгода для бизнеса

Как защитить облачную инфраструктуру — рассказываем на примере межсетевого экрана нового покол...

Как начать использовать AI/ML на практике

Бессерверные вычисления: что это за технология и кому она нужна

Чек-лист: как обеспечить безопасность облачной инфраструктуры

Искусственный интеллект

Что такое IaaS?

Что такое PaaS

Machine Learning

Data Science

Машинное обучение без учителя

Классическое машинное обучение

Нейронные сети

Глубокое обучение

Защита персональных данных: как легче соблюдать закон с Cloud.ru и сохранять спокойствие

Как сохранить IT-инфраструктуру и бизнес: руководство к действию

Машинное обучение и Big Data в кибербезопасности

Ответы на актуальные вопросы

Что такое DDoS-атаки, чем они опасны и как от них защититься

Аудит информационной безопасности: что это, зачем и когда его проводить

Межсетевые экраны: UTM, NGFW-системы, NTA, NDR

Обзор межсетевых экранов, систем IPS и IDS

PostgreSQL vs MySQL: какая система подходит вашему бизнесу

Основы резервного копирования

Специальное предложение «180 дней тестового периода резервного копирования» для всех клиентов
Платформа SberCloud Advanced теперь обеспечивает максимальный уровень защиты персональных данных

Что такое объектное хранилище S3 и как его используют

Customer Enablement: как SberCloud работает с клиентами, чтобы сделать миграцию в облако комфо...

Сеть доставки контента CDN: новые функциональные возможности и преимущества

Объясняем на кейсах: польза CDN для бизнеса

Новая Windows Server 2022 в облаке SberCloud — новые возможности клиентов

Запуск нового сервиса Managed OpenShift в облачной среде SberCloud

Как работает технология DNS

SberCloud Advanced запустила третью ресурсную зону доступности для комфортной работы клиентов

PostGIS в PostgreSQL — как можно использовать

GitLab для начинающих: как и для чего используется

Краткий обзор методологии CI/CD: принципы, этапы, плюсы и минусы

Персональные данные: правильно обрабатываем и храним

Кто и зачем использует облачные модели IaaS и PaaS

152-ФЗ в облаке: хранение персональных данных в облаке

Как работает CDN (Content Delivery Network)?

Service Level Agreement (SLA): все о соглашении об уровне сервиса

Что такое «интернет поведения» (IoB)?

Чек-лист: 6 шагов для успешной миграции в облако

Машинное обучение: просто о сложном

Профессия DevOps-инженер: кто это и чем занимается

Гайд по Kubernetes. Эпизод I: k8s для неразработчиков

Публичные, частные и гибридные облака: в чем разница?
