- tocdepth
2
Вопросы по работе с регионами
Сколько регионов доступно при создании окружений?
Название региона |
Описание региона |
---|---|
Christofari.V100 |
Окружение будет развернуто на узлах суперкомпьютера Christofari. В этом регионе доступно распределенное обучение. |
Christofari.A100 |
Окружение будет развернуто на узлах суперкомпьютера Christofari Neo. В этом регионе доступно распределенное обучение. |
Cloud.Region.A100 (GPU Tesla A100) |
Для выбора доступны конфигурации, использующие GPU и CPU. Для запуска задач доступна конфигурация, включающая до 8 GPU Tesla A100. Между серверами нет высокоскоростной сети, поэтому задачи можно запускать только до 8 GPU. |
Cloud.Region.HP1 |
Для выбора доступны конфигурации, использующие GPU и CPU. Для запуска задач доступна конфигурация, включающая до 8 GPU NVIDIA. Между серверами нет высокоскоростной сети, поэтому задачи можно запускать только до 8 GPU. В этом регионе два NFS-хранилища, поэтому он отображается как Cloud.Region.HP1 — NFS-1 и Cloud.Region.HP1 — NFS-2. |
Cloud.Region.HP |
Для выбора доступны конфигурации, использующие GPU и CPU. Для запуска задач доступна конфигурация, включающая до 8 GPU NVIDIA. Между серверами нет высокоскоростной сети, поэтому задачи можно запускать только до 8 GPU. |
См.также
Сколько регионов доступно при создании деплоев?
Название региона |
Описание региона |
---|---|
Christofari.V100 |
Деплой будет развернут на узлах суперкомпьютера Christofari. Для выбора доступны конфигурации, использующие GPU и CPU. |
Cloud.Region.CPU (CPU) |
Деплой будет развернут на инстансе Advanced. Для выбора доступны конфигурации, использующие GPU и CPU или только CPU. |
Как запустить задачу на Christofari.A100?
Для запуска задачи на Christofari.A100 нужно:
Использовать для обучения образ с версией Cuda не ниже 11.
Обратить внимание на то, что у каждого региона свое независимое NFS хранилище. Подробнее см. Работа на разных регионах размещения ресурсов.
При запуске задач обучения через client_lib в параметре
region
нужно указывать конкретный регион. Код модели возможно потребует изменений.Использовать образ, имеющий в названии окончание
a100
(например,jupyter-cuda11.0-tf2.4.0-pt1.7.1-gpu-a100
).
Быстрый старт для запуска задач на Christofari и Christofari Neo приведен на GitHub.
для Dev & Test