- tocdepth
2
Обучение моделей
В этом разделе приведены инструкции по подготовке и обучению моделей в модуле Environments платформы ML Space.
- Примеры препроцессинга данных
- Установить библиотеки из Git-репозитория
- Запустить процесс обучения
- Обучить модель с использованием PyTorch Elastic Learning
- Обучить модель с использованием библиотеки Horovod
- Сохранить промежуточные результаты обучения (чекпоинты)
- Собрать и использовать кастомный Docker-образ для задачи обучения на основе базового образа платформы
- Собрать и использовать кастомный Docker-образ для задачи обучения на основе внешнего образа
Перед началом работы
Убедитесь, что:
Вы авторизованы в личном кабинете https://console.cloud.ru, и у вас есть доступ к платформе ML Space.
Создан проект. Если проекта не существует, создайте его.
Создан воркспейс. Попросите коллег из требуемого воркспейса добавить вас в воркспейс и после добавления выберите его из раскрывающегося списка в шапке страницы.
Если воркспейс не существует, создайте новый.
Пользователь зарегистрирован. Для регистрации нового пользователя воспользуйтесь инструкцией.
Необходимые для обучения файлы загружены в хранилище и перенесены в хранилище NFS.
(Опционально) Версия client_lib в Jupyter Server актуальна.
Была ли статья полезной?
Запустили Evolution free tier
для Dev & Test
Получить
для Dev & Test