Облачная платформаEvolution

Запустить задачу обучения без выбора аллокации и очереди


В инструкции описан процесс запуска задач обучения без выбора аллокации и очереди.

Если при запуске задачи не указаны параметры allocation_name и queue_name, система автоматически направляет задачи в аллокацию и очередь по умолчанию, настроенную администратором проекта для данного воркспейса и региона.

Запустить задачу обучения с выбором аллокации и очереди можно через Public API, CLI или client_lib.


Используйте метод POST /public/v2/jobs для запуска задачи без выбора аллокации и очереди.

Пример запроса:

curl -X POST "https://api.ai.cloud.ru/public/v2/jobs" \
-H "Content-Type: application/json" \
-H "X-Api-Key: <api_key>" \
-H "X-Workspace-Id: <workspace_id>" \
-d '{
"script": "/home/jovyan/training/model_train.py",
"base_image": "cr.ai.cloud.ru/aicloud-base-images/py3.11-torch2.4.0:0.0.40",
"region": "SR006",
"instance_type": "a100.1gpu.8C.243G",
"type": "pytorch2",
"n_workers": 1,
"job_desc": "Training-job1",
}'

Где:

Проверить статус запущенной задачи можно через интерфейс Distributed Train или Public API.