- tocdepth
2
AI Services
Внимание
28 февраля 2025 года прекратим поддержку сервисов DataHub, Dataset Registry, Model Registry.
Сохраните метаинформацию из Dataset Registry и Model Registry при необходимости. Вместо DataHub используйте ресурсы Маркетплейса.
В маркетплейсе в разделе AI Services размещены сервисы для решения различных бизнес-кейсов, связанных с задачами обработки естественного языка (NLP), компьютерного зрения (CV) и т. д.
Размещение сервисов в AI Services доступно как open beta (без оплаты покупки) для тестирования спроса и гипотез.
Развертывание сервиса
Для развертывания сервиса в воркспейсе зайдите в карточку выбранного сервиса и нажмите Подключить.
Во всплывающем окне появится меню для создания деплоя.
Для создания деплоя:
В поле Название деплоя укажите желаемое название.
В поле Количество экземпляров выберите требуемое количество экземпляров деплоя.
Нажмите Создать деплой.
Примечание
Если первое значение в поле Количество экземпляров равно нулю, при отсутствии обращений к деплою произойдет его гибернация. Время выхода из гибернации составляет до пяти минут при наличии свободных ресурсов в регионе размещения.
Особенностью работы автоскейлинга при уменьшении количества экземпляров деплоя является остановка ресурсов, которая занимает 5-10 минут. Время остановки тарифицируется.
Перейдите в
для просмотра карточки деплоя развернутого сервиса.Отправка запросов к сервису, развернутому в виде деплоя
Ключи для получения предсказаний от развернутого деплоя позволяют отправлять запросы к нему, минуя этап аутентификации.
Для отправки запроса к деплою по ключу:
В главном меню платформы перейдите в
.Перейдите в карточку нужного деплоя.
Во вкладке Управление ключами нажмите Сгенерировать ключ.
Созданный ключ является уникальным.
(Опционально) Задайте описание ключа, нажав на плюс в столбце Описание.
Во вкладке Тест API нажмите cURL, чтобы скопировать запрос.
Запрос будет иметь следующий вид:
curl 'https://mlspace.ai.cloud.ru/deployments/dgx2-inf/kfserving-1629374788/v1/models/kfserving-1629374788:predict' \ -H 'content-type: application/json' \ -H 'x-workspace-id: ee8cd85f-1886-4bbe-a2db-12ce69206a26' \ --data-raw '{"key": "value"}'
Отправьте запрос.
import requests BASE_URL = "https://mlspace.ai.cloud.ru/deployments/dgx2-inf/kfserving-1629374788/v1/models/kfserving-1629374788:predict" results = requests.post( BASE_URL, json={"key": "value"}, headers={ "x-workspace-id": "ee8cd85f-1886-4bbe-a2db-12ce69206a26", "content-type":"application/json", "x-api-key":"i7uOAouA15uA0VHPYioaSQt4KN" } )
После отправки запроса счетчик в поле Предсказания увеличится на единицу.
Для удаления ключа:
В главном меню платформы перейдите в
.Перейдите в карточку нужного деплоя.
Во вкладке Управление ключами выберите ключ, который необходимо удалить, отметив чекбокс.
Нажмите на иконку в соответствующей строке списка.
В появившемся диалоговом окне подтвердите действие.
для Dev & Test