Пример сборки кастомного образа для деплоя
Docker registry используется для хранения Docker-образов. Создание кастомного Docker-образа для Inference позволяет развернуть требуемый образ (не используя базовый) в качестве деплоя.
Например, нужен веб-сервер в контейнере, который будет принимать пакеты по порту 8080.
Выполнение этой задачи предполагает:
Подготовку Dockerfile на локальной машине. В качестве базового можно использовать любой образ.
Подготовку репозитория для размещения образа (подробнее см. Действия с образами в Docker registry).
Сборку образа и отправку его в Docker registry (подробнее см. Начало работы с Docker-registry).
Результат создания образа для деплоя:
Dockerfile, в котором описана сборка веб-сервера, принимающего запросы на порт 8080.
Репозиторий в Docker registry с префиксом «deploy-», в который загружен образ, собранный из Dockerfile.
Деплой, запущенный на основе собранного образа.
Файлы для скачивания
Dockerfile
(при скачивании добавляется расширение txt, которое требуется удалить).
Алгоритм создания и проверки работоспособности веб-сервера из примера
Соберите образ из созданного Dockerfile (подробнее в документации Docker).
Присвойте образу название с префиксом «deploy-», тег и загрузите его в Docker registry (подробнее см. Действия с образами в Docker-registry), например:
cr.msk.sbercloud.ru/xxxxxxxxxx-xxxxxxx-xxxxx/deploy-test[:TAG]
Создайте деплой из Docker-образа загруженного на предыдущем шаге и запустите его (подробнее см. Развернуть модель (создать деплой)).
Проверьте корректность функционирования созданного деплоя, создав в разделе Тест API пустой запрос:
{}
В ответ должно прийти сообщение:
{ "message": "Success request to path=/v1/models/{DEPLOY-NAME}:predict" }