Спасибо за отзыв! Что можно улучшить?
Введите комментарий
Свяжитесь со мной
Электронная почта
Оставьте email, чтобы узнать об изменении или получить ответ на вопрос
Форма не отправлена
Попробуйте отправить заново
Отправить комментарий
/ Docs
Платформа
Evolution
Advanced
Облако VMware
ML Space
Кроссплатформенные
В консоль
AI Cloud ML Space, руководство пользователя облако Cloud.ru
Обзор ML Space
Преимущества
Возможности
Ограничения и особенности
Что нового
Переход на домен cloud.ru
Начало работы с ML Space
Концепции
Модули и сервисы ML Space
Data Catalog
Управление данными на платформе ML Space
Объектное хранилище ML Space
Data transfer service
Environments
Deployments
Типы деплоев
Карточка деплоя и образа
Пайплайны
Artifact registry и Docker registry
AI Marketplace
Подача заявки на размещение
DataHub
AI Services
Воркспейсы
Доступы и роли
Регионы размещения ресурсов
Аллокации
Переходы между статусами Jupyter Server
Образы для Jupyter Server
Образы для задач обучения
Образы для деплоев
Советы по оптимизации процесса обучения
Параметры пайплайнов
Лицензии для компонентов Open Source
Инструкции
Управление профилем и воркспейсом в ML Space
Создать или редактировать воркспейс
Удалить воркспейс
Посмотреть ключи для работы с платформой
Заказать детализацию потребления
Работа в Jupyter Server
Создать Jupyter Server и подключиться к нему через интерфейс ML Space
Создать и активировать окружение в запущенном Jupyter Server
Подключиться к Jupyter Server по SSH из локальной IDE или терминала
Установить и обновить библиотеки в созданном Jupyter Server
Собрать и использовать кастомный Docker-образ для Jupyter Server
Использовать Jupyter Server со Spark
Остановить или удалить Jupyter Server
Обучение моделей
Примеры препроцессинга данных
Установить библиотеки из Git-репозитория
Запустить процесс обучения
Обучить модель с использованием PyTorch Elastic Learning
Обучить модель с использованием библиотеки Horovod
Сохранить промежуточные результаты обучения (чекпоинты)
Собрать и использовать кастомный Docker-образ для задачи обучения
Мониторинг в ML Space
Проверить загрузку оборудования
Подключиться к TensorBoard
Подключиться к MLflow и провести эксперимент
Операции с аллокациями
Получать уведомления о событиях ML Space
Просмотреть аудит-логи сервисов ML Space
Подключение и работа с источниками данных
Создать бакет S3 ML Space
Получить credentials к S3
Получить ссылку на объект в S3 или NFS
Создать коннектор
Создать коннектор к экземпляру Relational Database Service SQL Server в Advanced
Операции над коннекторами
Создать правило переноса
Операции над правилами переноса данных
Загрузить данные в хранилище S3 средствами платформы
Загрузить данные на S3 с помощью сторонних инструментов
Переместить данные между S3 и NFS
Узнать или изменить квоты NFS на объем хранилища и количество файлов
Рекомендации по работе с архивами на NFS
Работа с объектами Artifact Registry
Работа с готовыми датасетами из Dataset registry
Работа с готовыми моделями в Model registry
Работа с Docker-образами
Пример операций над Docker-образом на платформе ML Space
Собрать кастомный Docker-образ для Deployments
Действия с образами в Docker registry
Переместить Docker-образ между воркспейсами
CLI-утилита и client_lib
Функция client_lib
Job
S3CopyJob
ImageBuildJob
Общие команды
Отключенные функции, параметры и команды client_lib
CLI-утилита ML Space
Описание команд и параметров
Экспортировать окружение в виде yml-файла
Отправить и получить окружение
Установить PyTorch в текущее окружение
Обновить окружение с помощью yml-файла
Удалить окружение
Подключиться по SSH к задаче обучения
Использовать GitLab CI при работе с Environments
Развертывание и эксплуатация моделей
Начало работы с деплоями
Сериализовать модель для использования в Deployments
Скрипты для прогнозирования на основе обученных моделей
Провалидировать serving-скрипт
Создать образ для деплоя
Развернуть модель (создать деплой)
Отправить синхронный HTTP-запрос к развернутой модели
Отправить асинхронный HTTP-запрос к развернутой модели
Пайплайны
Создать или отредактировать пайплайн
Использовать разные виды пайплайнов
Посмотреть логи пайплайна
Обучающие материалы
Большие языковые модели (LLM)
Возможности языковых моделей
Как работают большие языковые модели?
Как ML Space может помочь с LLM?
Общие подходы к настройке и обучению языковой модели
Distributed Data Parallel (DDP) в PyTorch
Общий алгоритм работы с PyTorch DDP
Пример использования PyTorch DDP
Руководства по работе с Jupyter Server
Работа с conda-окружениями
Миграция данных из хранилища S3 ML Space
Миграция данных из S3 ML Space в Advanced
Миграция данных из S3 ML Space в Evolution
Справочник API
Аутентификация в API ML Space
Начало работы с API
Отправка API-запроса через Postman
Работа с Docker registry через API
Решение проблем
Решение проблем при работе с данными
Ошибка «access denied» при скачивании из S3
Ошибка «Got permission denied while trying to connect to the Docker daemon» при загрузке образа в Docker registry для Linux
Не получается найти файлы после переноса на один из NFS
Решение проблем при обучении моделей
Ошибка NCCL WARN в логах задачи обучения
Ошибка «Permission denied, please try again» при запуске задачи обучения
Tensorflow/Pytorch не видит GPU, низкая скорость обучения
При выполнении команды «torch.cuda.is_available()» возвращается «False»
Ошибка «CUDA error: an illegal memory access was encountered»
Решение проблем при работе с Jupyter Servers
Ошибки при работе с окружениями, созданными с помощью CLI
Не получается установить CUDA средствами conda
Проблемы с подключением по SSH к Jupyter Server
Не могу создать Jupyter Server
Ошибки при недостатке места в NFS
Нестабильная работа терминала Jupyter Server из Яндекс.Браузера
Решение проблем при развертывании и эксплуатации моделей
Проблемы при выполнении асинхронного вызова
Не получается подключиться к GitLab ML Space через SSH
Вопросы и ответы
Общие вопросы ML Space
Вопросы по воркспейсам
Вопросы по регионам
Вопросы по подключению и работе с источниками данных
Artifact registry
Вопросы по окружениям и Jupyter Server
Вопросы по задачам обучения
Вопросы по Spark
Вопросы по развертыванию и эксплуатации моделей
Вопросы по асинхронным вызовам
Вопросы по пайплайнам
Вопросы по AI Marketplace
Тарификация
Термины и сокращения
Обратиться в поддержку
AI Cloud ML Space, руководство пользователя облако Cloud.ru
Главная
Алфавитный указатель
Алфавитный указатель
A
|
B
|
C
|
D
|
G
|
H
|
I
|
J
|
N
|
R
|
S
|
А
|
Б
|
В
|
Д
|
З
|
И
|
К
|
М
|
О
|
П
|
Р
|
Ч
A
API
B
Batch prediction
C
CSV
D
Docker registry
G
GPU
H
HDFS
HTTP
I
Inode
J
JSON
Jupyter Notebook
Jupyter Server
N
NFS
R
REST
S
S3
SSH
А
Аллокация
Асинхронный инференс
Б
Базовый образ
Бакет
В
Воркспейс
Д
Датасет
Деплой
З
Задача обучения
И
Инференс
Источник
К
Кастомный образ
Коннектор
Контейнер
М
Машинное обучение
Место назначения
О
Образ
Образ для задачи обучения
Объект
Окружение
П
Перенос
Под
Правило переноса
Препроцессинг
Р
Регион размещения вычислительных ресурсов
Ч
Чекпоинты
Была ли статья полезной?
Да
Нет
Запустили Evolution free tier
для Dev & Test
Получить