AI Marketplace

Что такое DataHub?

DataHub — маркетплейс артефактов (датасеты, модели, контейнеры) для глубокого и машинного обучения на платформе ML Space. На данный момент представлен юридически чистый партнерский контент по модели freemium.

Что такое ruGPT-3?

ruGPT-3 — это нейросеть, обученная более чем на 600 ГБ открытых данных: Википедии, художественной литературе, диалогах, программном коде. Нейросеть продолжает фразу пользователя, или «затравку», в виде программного кода, текстов на русском и частично на английском языке. Модели ruGPT-3 это:

  • 760 млн параметров (ruGPT-3 Large).

  • 1.3 млрд параметров (ruGPT-3 XL).

  • 13 млрд параметров (ruGPT-3 13B).

Для чего можно использовать ruGPT-3?

Нейросеть позволяет пользователям решать следующие бизнес-задачи:

  1. Создание рекомендательных систем (рекомендации фильмов, музыки и т.д.).

  2. Генерация отзывов (например, для бытовой техники, гаджетов и т.д.).

  3. Создание вопросно-ответной системы для русского StackOverflow.

  4. Создание диалоговых систем (например, консультант у провайдера).

Более подробно с моделями можно познакомиться на Github. Примеры использования API приведены в разделе Обучающие материалы. Для тестирования модели перейдите по ссылке.

Как развернуть модель ruGPT-3 на сервисе Deployments?

Модель ruGPT-3 (13 миллиардов параметров) можно развернуть на сервисе Deployments. Для этого:

  1. Нажмите Создать деплой на карточке модели.

  2. Задайте необходимое количество pods.

  3. Нажмите Создать деплой. Деплой будет создан автоматически.

Какие еще модели обучались или можно обучить на Christofari?

Датасет Golos — это размеченный вручную набор речевых данных на русском языке, включающий 1240 часов аудиоданных, а также обученную на них модель распознавания речи, которая показывает точность, сравнимую с человеческой. Датасет доступен к добавлению на бакет S3 (см. Обзор хранилища (Файловый менеджер)).

Что такое Cloud AI Services?

Cloud AI Services — это продукты Cloud.ru на базе искусственного интеллекта, направленные на решение прикладных бизнес-задач. Cloud AI Services предназначены для разработчиков конечных IT-систем и доступны по API из безопасной облачной инфраструктуры.

Кто целевой пользователь Cloud AI Services, нужны ли специализированные знания в области Data Science, чтобы ими пользоваться?

Для использования сервисов специальных знаний в DS не требуется. Например, чтобы пользоваться веб-браузером, вам не обязательно знать, какой код внутри, так как вы решаете свою задачу поиска информации. С Cloud AI Services такой же принцип, что делает их полезными и доступными для более широкого рынка.

Чем Cloud AI Services отличаются от обычных моделей искусственного интеллекта?

Cloud AI Services — это готовые продукты, над которым работают наши эксперты, контролируя их метрики качества. Сервисы уже развернуты в надлежащем облачном окружении, и вы можете пользоваться ими «из коробки» посредством API. Техническая поддержка инфраструктуры осуществляется на стороне Cloud.

Модели — это изолированные объекты, которые вы можете дорабатывать самостоятельно, если у вас есть эксперты в Data Science. При этом вы также самостоятельно контролируете метрики качества, обеспечиваете инфраструктуру, способы взаимодействия с моделью, поддержку.

Можно ли доработать сервисы под мои бизнес-задачи?

Это возможно при наличии у вас необходимых данных для обучения. Также, чтобы доработать сервис под вас, нам понадобятся примеры некорректной работы сервиса. Например, если это сервис распознавания номеров авто, то вам нужно будет показать нам фотографии и результат их неверного распознавания. Важно понимать, что доработка сервиса происходит только силами специалистов Cloud.ru, так как контроль работы и качества метрик сервиса осуществляется нами.

В какой инфраструктуре расположены сервисы?

Cloud AI Services развернуты в облачной инфраструктуре Cloud.ru ML Space (УЗ-1, ФЗ-152, реестр российского ПО, в основе — суперкомпьютеры Christofari.V100 и Christofari.A100). ML Space — это платформа полного цикла ML-разработки для совместной работы DS-команд. Поэтому, если у вас есть свои ML-разработчики (data scientists), то это инструмент для них. Платформу можно бесплатно протестировать, запросив доступ на сайте.