nav-img
Evolution

submit

mls job submit — команда для отправки задачи.

  • Использование: mls job submit COMMAND [ARGS] [OPTIONS]

Опции обязательные

Опция

Формат

Описание

-i--instance_type

[string]

Конфигурация ресурсов (e.g., v100.1gpu)

-I--image

[string]

Название образа

-t--type

[binary, horovod, pytorch, pytorch2, pytorch_elastic, spark, binary_exp]

Тип задачи обучения

-s--script

[ls -lah || OS.PATH(/home/jovyan/test_script.py)]

Путь к исполняемому файлу

Опции дополнительные

Опция

Формат

Описание

-d--description

[string]

Описание задачи

Опции профиля

Опция

Формат

Описание

-R--region

[DGX2-MT,A100-MT,SR002-MT,SR003,SR004,SR005,SR006,SR008]

Ключ региона

-O--output

[json, text]

Формат вывода в консоль

-E--endpoint_url

[string]

Базовый адрес API

-P--profile

[string]

Определить параметры региона, формат вывода по имени профиля

Опции для запуска задачи

Опция

Формат

Описание

-c--config

[OS.PATH]

Путь к YAML манифесту с описанием задачи

Опции для управления окружением

Опция

Формат

Описание

-e--conda_name

[string]

Название Conda окружения в образе

-f--flags

[-f key1=value1,key2=value2]

Дополнительные флаги

-v--variables

[-v key1=value1,key2=value2]

Переменные окружения

Опции для управления ресурсами

Опция

Формат

Описание

-w--workers

[INT GTE(0)]

Количество рабочих узлов

-p--processes

[INT || „default“]

Количество процессов

Опции для управления политиками

Опция

Формат

Описание

-a--internet_access

[bool]

Наличие доступа в интернет

-k--checkpoint_dir

[OS.PATH(/home/jovyan/…)]

Путь для сохранения checkpoint

--priority_class

[low, medium, high]

Приоритет выполнения задачи

Опции для управления в аллокации

Опция

Формат

Описание

-r--max_retry

[RANGE (3 .. 100)]

Макс. количество попыток перезапуска

Опции управления оповещением

Опция

Формат

Описание

--period

[INT]

Минутный интервал для отслеживания появления логов

--internal_action

[delete,restart]

Действие направленное к задачи обучения

–external_actions

[]

::[[«notify»]] Действие направленное к пользователю

Опции управления Pytorch Elastic

Опция

Формат

Описание

--elastic_min_workers

[INT || „default“]

Минимальное количество воркеров

--elastic_max_workers

[INT || „default“]

Максимальное количество воркеров

--elastic_max_restarts

[INT GTE(0)]

Максимальное количество перезапусков

Опции управления Pytorch2

Опция

Формат

Описание

--use_env

[bool]

Использовать torch.distributed.launch с –use_env

Опции управления Spark

Опция

Формат

Описание

--spark_memory

[float]

Объем памяти для Spark

Режим отладки

Опция

Формат

Описание

-D--debug

[bool]

Вывод в консоль отладочной информации