Облачная платформаEvolution

Создать и открыть инстанс


Вы можете отслеживать процесс обучения моделей в реальном времени с помощью инстансов Tensorboard, которые автоматически собирают метрики, создают наглядные визуализации и обеспечивают постоянный мониторинг экспериментов для оптимизации процесса машинного обучения.

Для создания инстанса:

  1. На верхней панели слева нажмите Кнопка с изображением девяти точек и перейдите в раздел Distributed Train → Мониторинг моделей.

  2. В правом верхнем углу нажмите Создать.

  3. (Опционально) Укажите название инстанса в поле Название.

    Поле заполняется автоматически. Вы можете ввести другое название для нового инстанса. Разрешается применять следующие символы: строчные латинские буквы от a до z, цифры от 0 до 9, дефис (–).

  4. (Опционально) Нажмите Добавить описание и заполните поле Описание.

  5. Выберите Ресурсы.

    Ориентируйтесь на цвет индикатора рядом с названием конфигурации:

    • Зеленый — свободных ресурсов достаточно для запуска сервера в выбранной конфигурации.

    • Желтый — свободных ресурсов мало для запуска серверов в этой конфигурации. Если планируете создать несколько таких серверов, ресурсов может не хватить.

    • Серый — свободных ресурсов не осталось. Выбрав эту конфигурацию, вы попадаете в очередь на высвобождение ресурсов. Jupyter Server будет иметь статус «Запускается».

      Чтобы не ждать, выберите другой регион или конфигурацию.

  6. Нажмите Продолжить.

  7. Образ tensorboard-image выбирается автоматически, он включает предустановленный Tensorboard и все необходимые интеграции для сбора метрик обучения. Дополнительная настройка не требуется.

  8. Настройте параметры профиля:

    1. В поле Log Dir укажите директорию для сохранения логов.

    2. (Опционально) Выберите из списка параметры запуска и укажите для них значения.

      Для добавления нового параметра нажмите Добавить параметр.

  9. Выберите тип доступа к инстансу:

    • Совместный — доступен для работы всем пользователям воркспейса.

    • Индивидуальный — доступен только пользователю, создавшему его.

  10. (Опционально) Настройте правила автоматического выключения.

  11. (Опционально) Подключите хранилище S3:

    1. Включите опцию Подключение хранилищ S3.

    2. Нажмите Выбрать бакеты.

    3. Выберите бакет или создайте новый бакет.

    4. (Опционально) Установите права только на чтение данных, если требуется ограничить права на запись данных.

    5. Нажмите Выбрать.

    6. Выберите способ аутентификации: Сервисный или Секрет. Способы различаются учетными данными, которые будут использоваться при аутентификации пользователя.


      Если выбран сервисный способ аутентификации, доступ к бакетам хранилища S3 осуществляется на уровне подключенного к проекту продукта Distributed Train.

    7. Нажмите Создать.

      Откроется главная страница сервиса Distributed Train. Инстанс будет создан и запущен в течение нескольких минут. Дождитесь, когда инстанс перейдет в статус «Подключен» и появится URL-адрес.

  12. На главной странице в строке инстанса нажмите Открыть.

    В результате откроется веб-интерфейс Tensorboard с доступом к мониторингу экспериментов.