В инструкции описан процесс запуска задач обучения без выбора аллокации и очереди.
Если при запуске задачи не указаны параметры allocation_name и queue_name, система автоматически направляет задачи в аллокацию и очередь по умолчанию, настроенную администратором проекта для данного воркспейса и региона.
Запустить задачу обучения с выбором аллокации и очереди можно через Public API, CLI или client_lib.
Используйте метод POST /public/v2/jobs для запуска задачи без выбора аллокации и очереди.
Пример запроса:
curl -X POST "https://api.ai.cloud.ru/public/v2/jobs" \-H "Content-Type: application/json" \-H "X-Api-Key: <api_key>" \-H "X-Workspace-Id: <workspace_id>" \-d '{"script": "/home/jovyan/training/model_train.py","base_image": "cr.ai.cloud.ru/aicloud-base-images/py3.11-torch2.4.0:0.0.40","region": "SR006","instance_type": "a100.1gpu.8C.243G","type": "pytorch2","n_workers": 1,"job_desc": "Training-job1",}'
Где:
<api_key> — ключ доступа к API.
<workspace_id> — идентификатор воркспейса.
Проверить статус запущенной задачи можно через интерфейс Distributed Train или Public API.