С помощью этой статьи вы установите Distributed Train CLI и запустите первую задачу обучения.
Python не ниже 3.10
UNIX-подобные ОС
Для работы с Distributed Train CLI на ОС Windows используйте утилиту cmder.
В терминале выполните команду:
pip install cloudru-ml-cli
SDK mls-core установится автоматически.
Выполните команду:
mls configure --profile profile-name
Введите следующие значения:
Key ID — соответствует ключу API Key ID, который можно сгенерировать в личном кабинете.
Key Secret — соответствует ключу API Key custom_connector_secret, который можно сгенерировать в личном кабинете.
x-workspace-id — соответствует параметру x-workspace-id, который можно посмотреть в параметрах разработчика Distributed Train.
x_api_key — соответствует параметру x-api-k, который можно посмотреть в параметрах разработчика Distributed Train.
Название региона по умолчанию — название региона размещения ресурсов.
Формат вывода по умолчанию — json или text.
https://адрес_api — https://api.ai.cloud.ru/public/v2
Выполните команду mls job submit для запуска задачи:
mls job submit \--script "echo Hello World" \--image cr.ai.cloud.ru/aicloud-base-images/py3.10-torch2.1.2:0.0.40 \--instance_type cpu.2C.8G \--type binary \--profile profile-name
Где:
--type — тип задачи.
--script — скрипт для запуска.
--image — базовый образ.
--instance_type — конфигурация ресурсов.
При успешном запуске будет получен ответ следующего вида:
{"job_name": "lm-mpi-job-00000000-0000-0000-0000-000000000000","status": "Pending","created_at": 1777469734}
Посмотрите логи запущенной задачи или запустите другие задачи обучения.