tocdepth

2

Вопросы по работе с регионами

Сколько регионов доступно при создании окружений?

Название региона

Описание региона

Christofari.V100

Окружение будет развернуто на узлах суперкомпьютера Christofari.

В этом регионе доступно распределенное обучение.

Christofari.A100

Окружение будет развернуто на узлах суперкомпьютера Christofari Neo.

В этом регионе доступно распределенное обучение.

Cloud.Region.A100 (GPU Tesla A100)

Для выбора доступны конфигурации, использующие GPU и CPU. Для запуска задач доступна конфигурация, включающая до 8 GPU Tesla A100.

Между серверами нет высокоскоростной сети, поэтому задачи можно запускать только до 8 GPU.

Cloud.Region.HP1

Для выбора доступны конфигурации, использующие GPU и CPU. Для запуска задач доступна конфигурация, включающая до 8 GPU NVIDIA.

Между серверами нет высокоскоростной сети, поэтому задачи можно запускать только до 8 GPU.

В этом регионе два NFS-хранилища, поэтому он отображается как Cloud.Region.HP1 — NFS-1 и Cloud.Region.HP1 — NFS-2.

Cloud.Region.HP

Для выбора доступны конфигурации, использующие GPU и CPU. Для запуска задач доступна конфигурация, включающая до 8 GPU NVIDIA.

Между серверами нет высокоскоростной сети, поэтому задачи можно запускать только до 8 GPU.

Сколько регионов доступно при создании деплоев?

Название региона

Описание региона

Christofari.V100

Деплой будет развернут на узлах суперкомпьютера Christofari. Для выбора доступны конфигурации, использующие GPU и CPU.

Cloud.Region.CPU (CPU)

Деплой будет развернут на инстансе Advanced. Для выбора доступны конфигурации, использующие GPU и CPU или только CPU.

Как запустить задачу на Christofari.A100?

Для запуска задачи на Christofari.A100 нужно:

  • Использовать для обучения образ с версией Cuda не ниже 11.

  • Обратить внимание на то, что у каждого региона свое независимое NFS хранилище. Подробнее см. Работа на разных регионах размещения ресурсов.

  • При запуске задач обучения через client_lib в параметре region нужно указывать конкретный регион. Код модели возможно потребует изменений.

  • Использовать образ, имеющий в названии окончание a100 (например, jupyter-cuda11.0-tf2.4.0-pt1.7.1-gpu-a100).

Быстрый старт для запуска задач на Christofari и Christofari Neo приведен на GitHub.

Запустили Evolution free tier
для Dev & Test
Получить