Какие новости за май — дайджест Cloud.ru
Новости цифровой среды AI Factory и сервисов Cloud.ru Evolution, свежие обновления платформ Cloud.ru Advanced и Облако VMware, а также улучшения инструментов контроля затрат, администрирования и не только.

Обновления платформы Cloud.ru Evolution
AI Factory
Evolution Managed RAG
Теперь при добавлении источника для базы знаний в сервис для обогащения языковой модели пользовательскими данными автоматически сканируются все его директории.
Evolution AI Agents
В сервисе для создания автономных ИИ-агентов изменили дизайн интерфейсов для инструмента EvoClaw.
Evolution Load Balancer
В версию 2 сервиса для балансировки сетевого трафика добавили возможность балансировать трафик на виртуальные IP.
Evolution Managed ClickHouse
В управляемую аналитическую СУБД на базе ClickHouse® добавили поддержку версии 25.8.
Evolution Managed Kubernetes
Внесли обновления в сервис для управления контейнерными приложениями в кластере Kubernetes:
Теперь, если ресурсы для создания кластера или группы узлов временно недоступны из-за высокого спроса, их нельзя выбрать при создании. Вместо них можно выбрать другие ресурсы, другую зону доступности или дождаться освобождения ресурсов.
Добавили возможность устанавливать плагин Agent Sandbox для развертывания изолированной среды выполнения ИИ-агентов.
Обновили плагин CSI Driver до версии 1.0.4.
Добавили поддержку Kubernetes 1.35.
Также добавили возможность устанавливать плагин Reloader для автоматического перезапуска рабочих нагрузок при обновлении конфигураций и секретов.
Evolution Managed OpenSearch
Добавили возможность настройки окна обслуживания для проведения технических работ.
Evolution Data Platform
Реализовали на платформе новые возможности:
произвели миграцию Control Plane в мультизональный кластер;
добавили возможность ручной остановки и возобновления инстансов дата-платформы для экономии ресурсов;
обновили систему уведомлений по событиям и авариям;
добавили индикаторы статусов кластеров для удобства при размещении инстанса продукта в кластер платформы.
Evolution Distributed Train
В сервисе для создания цифровых приложений с использованием суперкомпьютеров и ML реализовали новые возможности для управления задачами и средами разработки, расширили инструменты автоматизации, обновили пользовательские образы и улучшили работу с ресурсами.
Новый метод в Public API. Добавили метод Get Job Params, который позволяет просматривать параметры запущенной задачи. Больше о методе — в спецификации.
Проверка по тегу (digest) при работе с пользовательскими образами на серверах. Проверка гарантирует запуск задач на актуальной версии образа, исключая использование устаревшего содержимого с тем же тегом. Кеш обновляется автоматически, что предотвращает ошибки доступа к старым версиям файлов.
Обновление образа tensorboard-image. В новой версии:
добавлена поддержка режима multi experiments для одновременной работы с несколькими запусками;
реализован выбор директорий с логами обучения без перезапуска инстанса;
доступно сравнение наборов экспериментов из разных директорий;
Больше о создании инстанса TensorBoard — в документации.
Работа с TensorBoard через Distributed Train CLI и Public API. Реализовали возможность управления TensorBoard через интерфейсы командной строки и Public API.
Узнайте больше о методах Tensorboards в Public API и работе с TensorBoard в Distributed Train CLI.
Работа с Jupyter Server через Distributed Train CLI. Добавили возможность управления Jupyter Server с помощью команд CLI. Это расширяет сценарии автоматизации и позволяет выполнять операции из консоли. Подробнее о работе с Jupyter Server в Distributed Train CLI — в документации.
Новый образ Marimo-hub 0.1.0. Добавили образ с поддержкой инструмента Marimo для разработки и выполнения кода. Как и в Jupyter Server, код можно разбивать на ячейки, однако вместо линейного порядка выполнения используется единое дерево зависимостей. При изменении данных в одной ячейке все связанные ячейки обновляются автоматически.
Обновление образа jupyter-server. В новой версии 0.0.101:
Реализовали настройку ресурсов на основе данных cgroup Pod. Это обеспечивает корректное отображение доступных ресурсов и лимитов для ML-библиотек, что помогает предотвратить перегрузку системы при запуске вычислений.
Интегрировали поддержку терминального мультиплексора tmux. Теперь можно сохранять сессии при закрытии вкладки браузера или разрыве соединения, а также работать с несколькими панелями в рамках одной сессии для мониторинга логов, запуска скриптов и управления файлами.
Оптимизация работы с ресурсами CPU. В регионах SR004 и SR005 внедрили виртуальную файловую систему lxcfs для корректного отображения лимитов ресурсов. Это повышает производительность терминала при высокой нагрузке и помогает избежать ошибок, связанных с некорректным определением доступных ресурсов.
Обновление страниц воркспейса. В интерфейсе появились новые возможности для управления и навигации:
Добавили вкладку «Детали». На ней размещена информация о воркспейсе и параметры разработчика.
Добавили вкладку «Пользователи». Теперь можно просматривать список участников воркспейса и их роли.
Обновили разграничение доступа. Вкладки «Правила», «Аллокации и очереди» и «Мониторинг» отображаются только пользователям с соответствующими ролями.
Улучшили навигацию в таблице «Воркспейсы». Реализовали переход к воркспейсу по названию, а количество пользователей стало ссылкой на вкладку «Пользователи».
Оплата и контроль затрат
Проверка пересечений бюджетов. Система теперь проверяет пересечения по области и сроку действия бюджета при его создании — это исключает появление дублирующих бюджетов и снижает риск ошибок.
Редактирование бюджета. Появилась возможность изменять ключевые параметры бюджета: название, лимит и опцию приостановки ресурсов. Это позволяет быстрее обновлять настройки без создания нового бюджета.
Удаление бюджетов. Добавлена возможность удаления ненужных бюджетов — они исключаются из списка без возможности восстановления.
Настройки и администрирование
Упростили запрос на увеличение квот организации. Теперь это можно сделать через короткую форму в личном кабинете: достаточно выбрать нужные квоты, указать новые значения и отправить заявку.
Расширили возможности управления пользователями. В карточке пользователя теперь отображаются роли в организациях и проектах, полученные через группы. Также в блоке «Группы пользователя» доступен список групп, в которых состоит пользователь, с возможностью удалить его из группы. Это помогает быстрее управлять доступами и отзывать роли, назначенные через группы.
Версия Terraform 2.0.2
Обновили Terraform до версии 2.0.2. Теперь можно разворачивать реестры Evolution Artifact Registry с помощью IaC-подхода.
Обновления платформы Cloud.ru Advanced
На платформе Cloud.ru Advanced обновили провайдер Terraform до версии 1.79.0. Добавили:

Data Sources: | Ресурсы: |
|
|
Обновления платформы Облако VMware
Также продолжаем развивать Облако VMware — вендорскую платформу от ведущего поставщика решений IaaS, которая предоставляет инфраструктуру как услугу.
Удаленные рабочие столы (VDI)
В сервисе «Удаленные рабочие столы» появилась возможность открывать веб-консоль мастер-образа в личном кабинете. Теперь пользователи могут подключаться к мастер-образу через виртуальную консоль и устанавливать необходимое ПО. Все виртуальные машины, созданные на основе этого мастер-образа, автоматически унаследуют установленное программное обеспечение.
Больше о работе с мастер-образом — в документации.
Виртуальный ЦОД
В виртуальном ЦОД на базе VMware расширили доступность балансировщика ALB. Сервис стал доступен на площадке PD50-02 и теперь представлен практически на всех площадках. Использование балансировщика остается бесплатным.
Подробнее о настройке Advanced Load Balancer — в документации.
Виртуальный ЦОД с GPU
В вЦОД с GPU:
Обновили образы операционных систем. Актуализировали доступные ОС для виртуальных машин с GPU.
Расширили инфраструктуру GPU. Стали доступны хосты на платформе HGX с ускорителями A100-80 SXM на площадках PD30-01 и PD50-01.
Мониторинг (MONaaS)
Добавили метрики выделенных Edge Clusters. Теперь клиенты могут видеть утилизацию своих выделенных кластеров Edge в сервисном дашборде мониторинга.
Уведомления в личном кабинете
Расширили перечень уведомлений: теперь доступны оповещения об изменении размера репозитория резервного копирования, а также о подключении и отключении услуги. Это помогает своевременно контролировать состояние критически важных сервисов.
