Подключиться по SSH к исполняемой задаче обучения из терминала

К исполняемой в регионе задаче можно подключиться по протоколу SSH. Такое подключение позволяет пользователям оперативно просматривать информацию о задаче, а также выполнять отладку необходимых процессов.

Подключение по SSH возможно из терминала Jupyter Notebook или JupyterLab, а также из терминала своего персонального компьютера. Подключение возможно при соблюдении следующих условий:

  • Используется версия Jupyter Notebook 0.0.80 или выше.

  • Задача обучения отправлена в регион и запущена. Под уже стартовал. Если задача еще находится в очереди или уже завершилась, подключиться по SSH к ней не получится.

Основные шаги для настройки подключения по SSH приведены ниже.

  1. Создайте или подключитесь к уже существующему Jupyter Server.

  2. В открывшемся Jupyter Notebook / JupyterLab зайдите в терминал.

    Примечание

    Генерация SSH-ключей происходит автоматически при создании Jupyter Server. Пользовательские SSH-ключи будут находиться в рабочем каталоге /home/jovyan/.ssh и называться по имени namespace.

  3. В терминале выполните команду

jovyan@test-0:~$ aicloud jobs ssh your_job_id

your_job_id — это идентификатор задачи, отправленной для исполнения в регион (обязательный параметр).

Подключение к конкретному воркер-поду (worker) осуществляется с помощью параметра -w (--worker), с указанием его номера. По умолчанию подключение осуществляется к воркеру 0.

При желании можно вывести справку

jovyan@test-0:~$ aicloud jobs ssh --help
Usage: ssh jobs ssh [OPTIONS] JOB_NAME

  Ssh connection to training job by its name. By default will connect to
  the master process. With --worker (-w) option you can connect to a specific
  worker process

Arguments:
  JOB_NAME  Training_job id (like: lm-mpi-
            job-2d2fd049-a18a-4035-aba6-7a4b6ffbd2f4)  [required]


Options:
  -m, --master          Connect to master process (disabled)
  -w, --worker INTEGER  Connect to specific worker_N
  --help                Show this message and exit.

Обратите внимание на то, что подключение по SSH прервется в момент, когда завершится задача.