yandex
Калькулятор ценТарифыАкцииДокументацияО насКарьера в Cloud.ruНовостиЮридические документыКонтактыРешенияРеферальная программаКейсыПартнерство с Cloud.ruБезопасностьEvolutionAdvancedEvolution StackОблако VMwareML SpaceВ чем отличия платформ?БлогОбучение и сертификацияМероприятияИсследования Cloud.ruЛичный кабинетВойтиЗарегистрироватьсяEvolution ComputeEvolution Managed KubernetesEvolution Object StorageEvolution Managed PostgreSQL®Облако для мобильных и веб‑приложенийАналитика данных в облакеEvolution Bare MetalEvolution SSH KeysEvolution ImageСайт в облакеEvolution DNSEvolution VPCEvolution Load BalancerEvolution Magic RouterEvolution DiskХранение данных в облакеEvolution Container AppsEvolution Artifact RegistryEvolution Managed ArenadataDBEvolution Managed TrinoEvolution Managed SparkАналитика данных в облакеEvolution ML InferenceEvolution Distributed TrainEvolution ML FinetuningEvolution NotebooksCurator Anti-DDoSCurator Anti‑DDoS+WAFUserGate: виртуальный NGFWStormWall: Anti-DDoSEvolution TagsEvolution Task HistoryCloud MonitoringCloud LoggingАренда GPUAdvanced Object Storage ServiceAdvanced Elastic Cloud ServerAdvanced Relational Database Service for PostgreSQLРазработка и тестирование в облакеAdvanced Image Management ServiceAdvanced Auto ScalingDirect ConnectCDNCross-platform connectionAdvanced Enterprise RouterAdvanced Cloud Backup and RecoveryAdvanced Data Warehouse ServiceAdvanced Elastic Volume ServiceAdvanced Cloud Container EngineAdvanced FunctionGraphAdvanced Container Guard ServiceAdvanced Software Repository for ContainerAdvanced Document Database Service with MongoDBAdvanced Relational Database Service for MySQLAdvanced Relational Database Service for SQL ServerCloud AdvisorAdvanced Server Migration ServiceAdvanced Data Replication ServiceAdvanced API GatewayAdvanced CodeArtsAdvanced Distributed Message Service for KafkaAdvanced Distributed Message Service for RabbitMQAdvanced DataArts InsightAdvanced CloudTableAdvanced MapReduce ServiceAdvanced Cloud Trace ServiceAdvanced Application Performance ManagementAdvanced Identity and Access ManagementAdvanced Enterprise Project Management ServiceVMware: виртуальный ЦОД с GPUVMware: виртуальный ЦОДУдаленные рабочие столы (VDI)VMware: сервер Bare MetalИнфраструктура для 1С в облакеУдаленные рабочие столыМиграция IT‑инфраструктуры в облако3D-моделирование и рендерингVMware: резервное копирование виртуальных машинVMware: резервный ЦОДVMware: резервное копирование в облакоVMware: миграция виртуальных машин
Поиск
Связаться с нами

На маркетплейсе платформы ML Space появился инструмент для непрерывного обучения языковых моделей

На электронной витрине AI-сервисов, доступных в платформе ML Space, появилась новая версия модели ruGPT-3 large, обученная инструментом Molotilka (ML Toolkit for Continuous Learning). В модели реализована автоматизация постоянного дообучения с минимальным забыванием старых знаний. 

Новости
Иллюстрация для статьи на тему «На маркетплейсе платформы ML Space появился инструмент для непрерывного обучения языковых моделей»

Поток информации непрерывен, а события в мире напрямую отражаются на языке, в частности — делают высказывания правдивыми или ложными. 

Так языковая модель, обученная в 2021 году  не будет знать, что в 2022-ом Аргентина проиграла матч Саудовской Аравии, соответственно не сможет сгенерировать адекватные высказывания на эту тему.

Molotilka ruGPT-3 large создана для того, чтобы проводить непрерывное обучение языковых моделей с повторением заранее заданных этапов. Например, таких как скачивание актуальных данных из новостных источников, их препроцессинг, создание датасета для дообучения языковой модели и ее оценка на разных задачах. 

В основе сервиса лежит архитектура ruGPT-3, ранее обученная разработчиками на большом корпусе текстов из различных источников. Далее сеть дообучили и модифицировали с использованием технологии adapters, это помогло преодолеть проблему “забывания” знаний.

Данное решение может применяться в следующих случаях:

  • стандартное применение ruGPT-3 как языковой модели, обладающей актуальными знаниями о мире;

  • создание кастомизированных задач с постоянным дообучением на новых данных: классификация, извлечение информации, диалоговые системы и пр.

Пользователи платформы ML Space, желающие применить сервис для своих задач, могут развернуть деплой модели по кнопке и взаимодействовать с ней по API. 

Дарим до 20 000 бонусов
Дарим до 20 000 бонусов
4 000 бонусов — физическим лицам, 20 000 бонусов — юридическим
24 ноября 2022