Работа с разными регионами

Сколько регионов доступно при создании окружений?

Имя региона

Описание региона

Christofari.V100

Окружение будет развернуто на узлах суперкомпьютера Christofari.

В этом регионе доступно распределенное обучение.

Подробнее про характеристики оборудования в регионе см. Суперкомпьютер Christofari.

Christofari.A100

Окружение будет развернуто на узлах суперкомпьютера Christofari Neo.

В этом регионе доступно распределенное обучение.

Подробнее про характеристики оборудования в регионе см. Суперкомпьютер Christofari Neo.

Cloud.Region.A100 (GPU Tesla A100)

Для выбора доступны конфигурации, использующие GPU и CPU. Для запуска задач доступна конфигурация, включающая до 8 GPU Tesla A100.

Между серверами нет высокоскоростной сети, поэтому задачи можно запускать только до 8 GPU.

Подробнее про характеристики оборудования в регионе см. Регион Cloud.Region.A100 (GPU Tesla A100).

Cloud.Region.A100&CPU

Для выбора доступны конфигурации, использующие GPU и CPU. Для запуска задач доступна конфигурация, включающая до 8 GPU Tesla A100.

Между серверами нет высокоскоростной сети, поэтому задачи можно запускать только до 8 GPU.

Подробнее про характеристики оборудования в регионе см. Регион Cloud.Region.A100&CPU.

Сколько регионов доступно при создании деплоев?

Имя региона

Описание региона

Christofari.V100

Деплой будет развернут на узлах суперкомпьютера Christofari. Для выбора доступны конфигурации, использующие GPU и CPU.

Cloud.Region.CPU (CPU)

Деплой будет развернут на инстансе Advanced. Для выбора доступны конфигурации, использующие GPU и CPU или только CPU.

Как запустить задачу на Christofari.A100?

Для запуска задачи на Christofari.A100 нужно:

  • Использовать для обучения образ с версией Cuda не ниже 11.

  • Обратить внимание на то, что у каждого региона свое независимое NFS хранилище. Подробнее см. Работа на разных регионах размещения ресурсов.

  • При запуске задач обучения через client_lib в параметре region нужно указывать конкретный регион. Код модели возможно потребует изменений.

  • Использовать образ, имеющий в названии окончание a100 (например, jupyter-cuda11.0-tf2.4.0-pt1.7.1-gpu-a100).

Быстрый старт для запуска задач на Christofari и Christofari Neo приведен на GitHub.