С помощью этой статьи вы установите Distributed Train CLI и запустите первую задачу обучения.
Python не ниже 3.10
OS UNIX
Для работы с Distributed Train CLI на ОС Windows используйте утилиту cmder.
В терминале выполните команду:
pip install cloudru-ml-cli
SDK mls-core установится автоматически.
Выполните команду:
mls configure --profile profile-name
Введите следующие значения:
Key ID — соответствует ключу API Key ID, который можно сгенерировать в личном кабинете.
Key Secret — соответствует ключу API Key custom_connector_secret, который можно сгенерировать в личном кабинете.
x-workspace-id — соответствует параметру x-workspace-id, который можно посмотреть в параметрах разработчика Distributed Train.
x_api_key — соответствует параметру x-api-k, который можно посмотреть в параметрах разработчика Distributed Train.
Название региона по умолчанию — название региона размещения ресурсов.
Формат вывода по умолчанию — json или text.
https://адрес_api — https://api.ai.cloud.ru/public/v2
С помощью команды submit, указанной ниже, запустится задача:
типа pytorch2,
из скрипта test_pytorch2_torch2.py, расположенного в /home/jovyan/jobs_tests/,
с базовым образом cr.ai.cloud.ru/aicloud-base-images/py3.10-torch2.1.2:0.0.40,
типом инстанса v100.1gpu.
mls job submit --script /home/jovyan/jobs_tests/test_pytorch2_torch2.py --image cr.ai.cloud.ru/aicloud-base-images/py3.10-torch2.1.2:0.0.40 --instance_type v100.1gpu --type pytorch2 --profile profile-name
Посмотрите логи запущенной задачи или запустите другие задачи обучения.