Облачная платформаEvolution

Запустить задачу обучения


Рассмотрим на примере типа задачи binary.

  1. Создайте файл binary.yaml со следующим содержимым:

    job:
    description: Test job
    environment:
    image: cr.ai.cloud.ru/aicloud-base-images/py3.10-torch2.1.2:0.0.40
    policy:
    allocation_name: payg
    resource:
    instance_type: cpu.2C.8G
    workers: 1
    script: echo "Hello World!" && sleep 30 && echo "Job finished."
    type: binary
  2. Запустите задачу обучения с заданными в файле параметрами:

    mls job submit -c binary.yaml

    При успешном запуске будет получен ответ следующего вида:

    {
    "job_name": "lm-mpi-job-00000000-0000-0000-0000-000000000000",
    "status": "Pending",
    "created_at": 1777469734
    }
  3. (Опционально) Переопределите параметры задачи обучения:

    mls job submit -c binary.yaml --instance_type cpu.8C.32G

Что дальше

Посмотрите логи и статус запущенной задачи.