- tocdepth
2
В этом документе
- Обзор ML Space
- Начало работы с ML Space
- Концепции
- Инструкции
- Управление профилем и воркспейсом в ML Space
- Работа в Jupyter Server
- Создать Jupyter Server и подключиться к нему через интерфейс ML Space
- Создать и активировать окружение в запущенном Jupyter Server
- Подключиться к Jupyter Server по SSH из локальной IDE или терминала
- Установить и обновить библиотеки в созданном Jupyter Server
- Собрать и использовать кастомный Docker-образ для Jupyter Server
- Использовать Jupyter Server со Spark
- Остановить или удалить Jupyter Server
- Обучение моделей
- Примеры препроцессинга данных
- Установить библиотеки из Git-репозитория
- Запустить процесс обучения
- Обучить модель с использованием PyTorch Elastic Learning
- Обучить модель с использованием библиотеки Horovod
- Сохранить промежуточные результаты обучения (чекпоинты)
- Собрать и использовать кастомный Docker-образ для задачи обучения
- Мониторинг в ML Space
- Подключение и работа с источниками данных
- Создать бакет S3 ML Space
- Получить credentials к S3
- Получить ссылку на объект в S3 или NFS
- Создать коннектор
- Создать коннектор к экземпляру Relational Database Service SQL Server в Advanced
- Операции над коннекторами
- Создать правило переноса
- Операции над правилами переноса данных
- Загрузить данные в хранилище S3 средствами платформы
- Загрузить данные на S3 с помощью сторонних инструментов
- Переместить данные между S3 и NFS
- Узнать или изменить квоты NFS на объем хранилища и количество файлов
- Рекомендации по работе с архивами на NFS
- Работа с объектами Artifact Registry
- Работа с Docker-образами
- CLI-утилита и client_lib
- Использовать GitLab CI при работе с Environments
- Развертывание и эксплуатация моделей
- Начало работы с деплоями
- Сериализовать модель для использования в Deployments
- Скрипты для прогнозирования на основе обученных моделей
- Провалидировать serving-скрипт
- Создать образ для деплоя
- Развернуть модель (создать деплой)
- Отправить синхронный HTTP-запрос к развернутой модели
- Отправить асинхронный HTTP-запрос к развернутой модели
- Пайплайны
- Обучающие материалы
- Справочник API
- Решение проблем
- Решение проблем при работе с данными
- Решение проблем при обучении моделей
- Ошибка NCCL WARN в логах задачи обучения
- Ошибка «Permission denied, please try again» при запуске задачи обучения
- Tensorflow/Pytorch не видит GPU, низкая скорость обучения
- При выполнении команды «torch.cuda.is_available()» возвращается «False»
- Ошибка «CUDA error: an illegal memory access was encountered»
- Решение проблем при работе с Jupyter Servers
- Решение проблем при развертывании и эксплуатации моделей
- Не получается подключиться к GitLab ML Space через SSH
- Вопросы и ответы
- Тарификация
- Термины и сокращения
- Обратиться в поддержку
Была ли статья полезной?
Запустили Evolution free tier
для Dev & Test
Получить
для Dev & Test