tocdepth

2

Создать инференс в ML Inference

С помощью инструкции вы создадите инференс модели в сервисе ML Inference. Для запуска инференса используются модели из библиотеки Hugging Face.

Перед началом работы

  1. Зарегистрируйтесь в Hugging Face, если у вас еще нет аккаунта.

  2. Получите токен доступа (User Access Token). Токен позволит использовать модели из приватных репозиториев Hugging Face.

  3. Создайте секрет в сервисе Secret Manager, указав полученный в Hugging Face токен.

Создать инференс

  1. В личном кабинете перейдите в раздел ML/AI Инструменты → ML Inference.

  2. Нажмите Создать.

  3. Заполните поле Название — произвольное название инференса, может совпадать с именем модели.

  4. Нажмите Добавить и укажите адрес репозитория в Hugging Face, откуда будет загружаться модель.

  5. Если репозиторий приватный, выберите секрет с токеном Hugging Face, который вы загружали перед началом работы.

  6. Нажмите Добавить.

  7. Поле Задача модели будет заполнено автоматически после добавления адреса репозитория. При необходимости скорректируйте значение в поле.

  8. Выберите необходимый объем памяти GPU.

  9. Нажмите Продолжить.

  10. Задайте настройки масштабирования:

  11. (Опционально) Активируйте опцию Аутентификация для аутентификации пользователя при вызове модели через публичный URL.

  12. (Опционально) Активируйте опцию Логирование запросов для ведения журнала запросов к модели.

  13. Нажмите Создать.

Вы будете перенаправлены на страницу сервиса ML Inference. Инференс будет создан и запущен в течение нескольких минут. Дождитесь, когда инференс перейдет в статус «Запущено» и появится публичный URL-адрес.

Запустили Evolution free tier
для Dev & Test
Получить