Только для юрлиц

Вычислительные мощности с GPU

Аренда виртуальных машин, серверов и ML-сервисов с графическими ускорителями

Платформы: ML Space, Evolution

  • Преимущества
  • Тарифы
  • Сценарии
  • Графические ускорители
  • Эффективность
  • Возможности
  • FAQ
  • Вебинары
  • Статьи

Графические ускорители GPU необходимы для обработки больших объемов данных, особенно требующих вычислений с плавающей запятой. Такие мощности — подходящий инструмент для ресурсоемких AI и ML-приложений. Например, для обучения и инференса нейронных сетей и языковых моделей, анализа данных. GPU также нужны для работы с качественной графикой, 3D-моделированием, рендерингом или видео.

Виртуальные машины

Идеальный вариант для начальных стадий разработки и тестирования благодаря простой гибкой настройке.

Виртуальные машины с GPU позволяют быстро развернуть инфраструктуру с нужными ресурсами и масштабироваться по мере необходимости.

ML-сервис

Подходящий вариант для ускорения разработки и обучения моделей. Вычисления происходят на мощных одиночных или кластерных узлах с поддержкой Infiniband, чтобы обеспечить высокую пропускную способность с минимальными задержками.

ML-сервис с GPU позволяет масштабировать ресурсы и автоматизировать процессы обучения и инференса сложных моделей.

Выделенный сервер

Оптимальный вариант для задач, которые требуют непрерывной работы GPU, или работы с интенсивными вычислительными задачами.

Выделенные серверы с GPU обеспечивают максимальную производительность с полным контролем над аппаратными ресурсами.

Преимущества использования GPU

Ускоренное выполнение задач

GPU значительно ускоряют вычисления с плавающей запятой, сокращают время обучения и вывода модели

Эффективное использование ресурсов

Графические ускорители обрабатывают параллельные задачи, максимизируют использование ресурсов, снижают стоимость вычислений

Повышенная производительность

Мощности с GPU обеспечивают высокую производительность AI- и ML-приложений, что позволяет быстрее получать результаты

Тарифы аренды вычислительных мощностей с GPU

ВозможностиВыделенный серверВиртуальная машинаML-сервис
Гибкость конфигурацииСредняяВысокаяСредняя
Контроль над ресурсамиПолныйЧастичныйЧастичный
Обучение на нескольких GPUДаДаДа
Распределенное обучение (Multi-node)НетНетДа
Поддержка сетевых подключений InfinibandВ зависимости от конфигурацииНетДа
Поддержка NVLinkВ зависимости от конфигурацииНетВ зависимости от конфигурации
Предустановленное ML-окружениеНетНетДа
ТарификацияМесяцЧасМесяц/Минута
Круглосуточная поддержкаДаДаДа
Модель оплатыAllocatedPay-as-you-goAllocated / Pay-as-you-go
Цена (с НДС)От 5 355 000 руб. в месяц
HGX (8xH100 80GB)
V100 от 240 руб за часV100 от 2,5 руб за минуту
A100 от 4,5 руб за минуту
H100 от 9,5 руб за минуту

Основные сценарии использования

img

Сократить время с нескольких недель до нескольких часов на разработку, тестирование и внедрение нейронных сетей для компьютерного зрения, обработки естественного языка или рекомендательных систем

Графические ускорители

МодельvRAMПропускная способность памятиДоступные конфигурацииFP32 TFLOPSFP16 TFLOPSПоддержка NVLink
H10080 ГБ HBM2e/HBM33.35 ТБ/с1,2,4,8x67~1000Да
A10040/80 ГБ HBM2e1.55 ТБ/c (40 ГБ vRAM) или 2 ТБ/с (80 ГБ vRAM)1,2,4,8x19.5312Да
V10016/32 ГБ HBM2900 ГБ/с1,2,4,8,16x16.4125Да
A4048 ГБ GDDR6700 ГБ/с1,2x17.4304Да

Наличие видеокарт уточняйте у менеджера через заявку на консультацию

Эффективность использования GPU в облаке

Низкие стартовые затраты

Преимущество: аренда виртуальных машин по мере необходимости исключает большие начальные инвестиции в аппаратное обеспечение.

Экономия: оплата только за используемые ресурсы сокращает расходы.

Ускорение научных и инженерных разработок

Преимущество: облачные ресурсы быстро масштабируют вычислительные мощности для сложных задач.

Экономия: время на исследования сокращается, команды R&D быстрее переходят от экспериментов к внедрению.

Высокая производительность

Преимущество: полный доступ к мощным аппаратным ресурсам обеспечивает высокую производительность.

Экономия: скорость выполнения задач сокращает время на разработку и вывод продукта на рынок.

Гибкость в изменении конфигураций

Преимущество: возможность быстро менять конфигурации виртуальных машин под текущие задачи.

Экономия: регулирование ресурсов в зависимости от нагрузок оптимизирует затраты.

Снижение затрат на рабочую силу

Преимущество: ML-сервисы автоматизируют рутинные задачи из MLOps цикла.

Экономия: рабочее время сотрудников распределяется  на более важные и сложные задачи.

Сокращение переменных затрат

Преимущество: удобное планирование бюджета с фиксированными затратами на выделенные серверы.

Экономия: долгосрочная аренда снижает переменные затраты.

Оптимально для краткосрочных задач

Преимущество: подходит для краткосрочных проектов или временных нужд.

Экономия: нет необходимости в долгосрочной аренде или покупке дорогостоящего оборудования.

Проверка гипотез

Преимущество: доступ к нужной конфигурации ресурсов ускоряет тестирование новых идей и гипотез.

Экономия: существенное сокращение времени и затрат на развертку тестовой среды и экспериментальные вычисления.

Полный контроль над конфигурацией

Преимущество: возможность настроить сервер для специфических задач.

Экономия: эффективное использование ресурсов, снижение затрат на администрирование и обслуживание благодаря настройке под конкретные нужды.

FAQ

Как подключить сервер с GPU?

Чтобы заказать вычислительные мощности, оставьте заявку в форме. Персональный менеджер свяжется с вами, ответит на все вопросы, рассчитает стоимость и подготовит коммерческое предложение.

Как выбрать подходящий GPU?

Для выбора подходящей конфигурации GPU важно учитывать характер задачи.

Если требуется параллельная обработка больших объемов данных или тренировка больших языковых моделей, рассмотрите H100 или A100 — они поддерживают NVLink и конфигурации с несколькими картами (два и более GPU).

Для менее требовательных задач подойдут V100 или A40, обеспечивающие отличную производительность для средних вычислительных нагрузок.

Также стоит учитывать потребности в оперативной памяти, дисковом пространстве и при необходимости обращаться к нашей технической поддержке.

Где находятся дата-центры Cloud.ru?

Cloud.ru пользуется надежными современными дата-центрами, расположенными в России. Все ЦОД прошли сертификацию на соответствие международным нормам и требованиям по надежности и безопасности, отвечают требованиям стандарта Tier III. Все облачные платформы Cloud.ru имеют уровень защиты 152-ФЗ УЗ-1.

Какие фреймворки и библиотеки машинного обучения поддерживаются?

Наши серверы оптимизированы для работы с популярными фреймворками и библиотеками, например, TensorFlow, PyTorch, CUDA, используемыми в задачах искусственного интеллекта и машинного обучения.

Кто может помочь, если появятся вопросы?

Наша служба поддержки доступна круглосуточно. Она поможет с любыми вопросами или проблемами, которые могут возникнуть при использовании серверов с GPU.

Обратиться в поддержку можно любым из удобных способов:

  • написать в чат в личном кабинете;

  • позвонить по телефону 8 800 444-24-99 (звонок из России бесплатный);

  • отправить письмо на support@cloud.ru.

Способы обращения в поддержку и рекомендации по составлению заявки

Какие операционные системы поддерживаются?

Наши серверы с GPU поддерживают различные операционные системы, включая Linux (Ubuntu, CentOS, Debian). Операционную систему можно выбрать при создании виртуальной машины.

Какой SLA для серверов с GPU?

SLA для серверов с GPU зависит от выбранного типа мощностей и начинается от 99.95%.

Вебинары

Заявка на консультацию