Что нового

2023

Декабрь

Переход на домен *.cloud.ru

С 12.12.2023 изменятся URL-адреса для доступа к Jupyter Servers, docker-образам, SSH, GitLab и public API. Переведите на новый домен технические решения, в которых используются эти ресурсы.

Подробнее см. Переход на домен cloud.ru.

Обновления в форме выбора образа при создании Jupyter Server

Теперь в интерфейсе отображается больше информации об образе: доступность в регионах, дата загрузки, версии установленных Python, CUDA, Tensorflow. Появилась возможность выбрать версию образа и найти нужный образ по названию.

Подробнее см. Создать Jupyter Server.

Ноябрь

Лимит на количество файлов в NFS

Узнать лимит на количество файлов в хранилище NFS теперь можно на главной странице.

Подробнее см. Узнать или изменить квоты NFS.

Новый параметр legacy в пайплайнах

Через параметр legacy вы можете задать схему логирования при создании правила переноса в пайплайнах.

Подробнее см. Описание параметров пайплайна.

Опубликованы образы, в которых установлены новая версия CUDA и Python

Образы для задач обучения с тегом 0.0.36, в которых установлены версии CUDA до 12.1, Python до 3.11, Torch до 2.0.

Подробнее см. Библиотеки в образах.

Опубликован образ jupyter-server, в который можно установить требуемые версии Python и CUDA

В образ cr.ai.cloud.ru/aicloud-jupyter/jupyter-server:0.0.90 можно установить требуемые версии CUDA и Python.

Октябрь

Мониторинг зависших задач в client_lib и API

С помощью health_params в client_lib и в API можно отслеживать зависшие задачи обучения и задавать, какие действия выполнять в случае зависания.

При указании несуществующего образа задача не запустится через client_lib или API

Если запустить задачу с несуществующим образом через client_lib или API, это вызовет ошибку. Задача не будет отправлена на выполнение в регион и не займет ресурсы.

Вы можете выбрать корректный образ из списка образов для задач обучения, а также создать или загрузить собственный кастомный образ.

Обновления в логах переносов

Появилась новая схема логирования. В ней события одного типа группируются в одну запись, которая содержит количество объектов и путь до последнего.

Подробнее см. Правила переноса данных.

Сентябрь

Новый параметр checkpoints_dir в client_lib

Использование параметра checkpoints_dir упрощает сохранение промежуточных результатов обучения модели, если в задаче обучения возникли технические ошибки. Подробнее см. checkpoints_dir.

Индикация загруженности типа конфигурации при создании Jupyter Server

При создании Jupyter Server рядом с названием конфигурации отображается цветовая индикация, которая показывает загруженность ресурсов. Подробнее см. Создать Jupyter Server.

Июль

Расширенный статус подов деплоя

Добавили в карточку деплоя новую вкладку с информацией о последних 200 экземплярах деплоя, включая статус и тарифицируемое время. Подробнее см. Проверить состояние деплоя.