Подключиться по SSH к задаче обучения из терминала

К исполняемой в регионе задаче можно подключиться по протоколу SSH. Такое подключение позволит оперативно просматривать информацию о задаче, а также выполнять отладку.

Условия подключения по SSH

Подключение по SSH возможно из терминала Jupyter Notebook или JupyterLab, а также из терминала своего персонального компьютера. Для подключения должны быть соблюдены следующие условия:

  • При создании Jupyter Server использован образ версии 0.0.80 и выше.

  • Задача обучения отправлена в регион и запущена, под стартовал. Если задача еще находится в очереди или уже завершилась, подключиться по SSH к ней не получится.

Настройка подключения по SSH

Чтобы подключиться по SSH из терминала Jupyter Notebook или JupyterLab:

  1. Создайте или подключитесь к уже существующему Jupyter Server.

  2. В открывшемся Jupyter Notebook / JupyterLab перейдите в терминал.

    Примечание

    SSH-ключи генерируются автоматически при создании Jupyter Server. Пользовательские SSH-ключи находятся в рабочем каталоге /home/jovyan/.ssh и называются так же, как namespace.

  3. В терминале выполните команду:

jovyan@test-0:~$ aicloud jobs ssh your_job_id

Где your_job_id — обязательный параметр, который обозначает идентификатор задачи, отправленной на исполнение в регион.

Примечание

Подключение по SSH прерывается в момент, когда завершается задача.

Подключиться к конкретному воркер-поду (worker) можно с помощью параметра -w (--worker), указав номер воркера. По умолчанию подключение осуществляется к воркеру 0.

Чтобы вывести справку, используйте команду --help:

jovyan@test-0:~$ aicloud jobs ssh --help
Usage: ssh jobs ssh [OPTIONS] JOB_NAME

  Ssh connection to training job by its name. By default will connect to
  the master process. With --worker (-w) option you can connect to a specific
  worker process

Arguments:
  JOB_NAME  Training_job id (like: lm-mpi-
            job-2d2fd049-a18a-4035-aba6-7a4b6ffbd2f4)  [required]


Options:
  -m, --master          Connect to master process (disabled)
  -w, --worker INTEGER  Connect to specific worker_N
  --help                Show this message and exit.
Масштабная конференция
GoCloud 2024:
облачные грани будущего