Поиск
Государство

Ведущий НИИ страны проводит исследования нейронных сетей на платформе Cloud.ru ML Space для совершенствования технологии автоматического машинного обучения

Гибкое предоставление ресурсов в каждом месяце, оплата по факту потребления, возможность оценить платформу на этапе тестирования стали сильными преимуществами Cloud.ru при выборе облачного провайдера.

О компании

ФАУ ГосНИИАС, ведущий институт в области перспективной авионики, создает моделирующие среды любой степени сложности. Основан в 1946 году.

Задача

ГосНИИАС разрабатывает технологию автоматического машинного обучения, в том числе для решения задач компьютерного зрения. Один из этапов разработки — исследования алгоритмов нейронных сетей по трем направлениям:

  • формирование архитектуры нейронной сети;
  • подбор гиперпараметров;
  • квантование.

Для проведения исследований институту была нужна облачная ML-платформа. Решение использовать облачные мощности обосновывалось тем, что в отличие от локальной инфраструктуры их можно гибко и быстро масштабировать в обе стороны.

К облачному провайдеру НИИ выдвигал ряд требований:

  • графические ускорители Nvidia A100 для операций с плавающей точкой одинарной точности;
  • круглосуточный доступ к вычислительному кластеру, чтобы в любой момент подключаться для мониторинга ресурсов и запуска обучения моделей;
  • возможность запускать свои docker-контейнеры и устанавливать свое ПО, собирать образы и загружать свои библиотеки.

Почему Cloud.ru

На этапе тестирования мы оценили удобство пользования платформой Cloud.ru ML Space: всю заботу об инфраструктуре провайдер берет на себя. Еще Cloud.ru предложил более мощные узлы и гибкие возможности масштабирования, чем другой провайдер. Иван Сгибнев начальник лаборатории автоматического машинного обучения, ГосНИИАС

Решение

После тестирования НИИ арендовал вычислительные мощности платформы Cloud.ru ML Space: сервер управления, систему хранения данных и графические ускорители. Платформа подходит для разработки цифровых приложений с использованием суперкомпьютеров и машинного обучения на базе российского решения. Внутри нее есть холодное хранилище S3 для хранения большого объема данных и горячее NFS для данных, которые необходимы в моменте обучения моделей.

Особенность Cloud.ru ML Space в том, что мощности подбираются и масштабируются автоматически под задачу, потребности и бюджет НИИ. И в том, что клиент может работать в ней со своими инструментами: фреймворками и контейнерами. Также он может реплицировать готовые модели машинного обучения и самостоятельно запускать их резервное копирование.

Результат

Заказчик может грамотно планировать свои ресурсы, он полностью контролирует процесс потребления и управления: два раза в день ему приходит отчет мониторинга, по которому видит загрузку GPU и видеокарт, свободные ресурсы.

Со своей стороны провайдер гарантирует бесперебойное функционирование ресурсов через фиксированный SLA.

Мы участвовали в конкурсной процедуре и смогли подготовить оптимальное решение. Наша цель в этом проекте — быть полезными и стать проверенным провайдером ведущего НИИ страны. Максим Зимин руководитель направления по работе с государственным сектором, Cloud.ru

Запросите бесплатную консультацию по вашему проекту

Cloud