

Генерация текста на любые темы, 1.3 млрд параметров
Описание
Подключите свое приложение к самой большой нейросети для русского языка ruGPT-3.
Демо модели ruGPT-3 1.3B. Для перехода в swagger нажмите кнопку Подключить.
Модели ruGPT-3, доступные в open source — это:
- 760 миллионов параметров (ruGPT-3 Large).
- 1.3 млрд параметров (ruGPT-3 XL).
- Длина контекста — 2048
- Перплексия на тестовой выборке — ruGPT-3 Large 13.6, ruGPT-3 XL 12.05
Модели умеют продолжать тексты на русском и частично на английском языках. Для этого пользователю необходимо сформулировать «затравку» - фразу, которую модель допишет.
Нейросеть обучена на более чем 600 Гб открытых данных: википедии, художественной литературе, диалогах, программном коде.
Нейросеть демонстрирует state-of-the-art возможности для русского языка и умеет продолжать любой текст. Результат, который будет получен с помощью применения модели, не может быть предсказан заранее.
Цель этой страницы – удовлетворить исследовательский интерес научного сообщества, а также предложить API ruGPT-3 разработчикам приложений, диалоговых и рекомендательных систем, текстовых классификаторов и т.д.
Примеры "затравок"
В примерах ниже курсивом выделено сгенерированное продолжение.
Диалоговые системы:
system: Добрый день! Чем могу помочь? user: Добрый день! С утра не работает интернет. Тариф 500мбит system: хорошо, сейчас попробуем исправить. Ждите.
Рекомендательные системы с нуля:
"Физик Максим, 28 лет, больше всего любит фильмы: «Улица Сезам», «Матрица».
Тематическая классификация текстов:
Новость: В России выведен на полную мощность самый быстрый в мире суперкомпьютер «Кристофари» Категория: Новости науки, техника и технологии.
Подробнее о ruGPT-3
vc.ru: рассказываем о применимости для бизнеса
Habr (tutorial): Тестируем ruGPT-3 на новых задачах
Habr, статья про обучение модели: Русскоязычная модель GPT-3 Large с 760 миллионами параметров в открытом доступе
Habr, статья про кейсы применения модели: Всё, что нам нужно — это генерация
Вебинар, спикер Татьяна Шаврина: Разбираем кейсы реального применения ruGPT-3
Вебинар, спикер Татьяна Шаврина: Полный цикл дообучения ruGPT-3 на платформе ML Space и примеры рыночных кейсов
Модель ruGPT-3 обучена и развёрнута с помощью платформы ML Space и суперкомпьютера «Christofari» от Cloud.ru.
Архитектура нейросети ruGPT-3 основывается на решении Generative Pretrained Transformer 3 от OpenAI.
Дисклеймер
При использовании демо модели ruGPT-3 XL ответы формируются на автоматической основе. ООО «Облачные технологии» не несет ответственности за точность, релевантность, корректность информации, полученной пользователем посредством данного демо.
Лицензирование
Модель ruGPT-3 XL и ее исходный код поставляются на основе открытой лицензии Apache 2.0