yandex
Калькулятор ценТарифыАкцииДокументацияО насКарьера в Cloud.ruНовостиЮридические документыКонтактыРешенияРеферальная программаКейсыПартнерство с Cloud.ruБезопасностьEvolutionAdvancedEvolution StackОблако VMwareВ чем отличия платформ?БлогОбучение и сертификацияМероприятияИсследования Cloud.ruЛичный кабинетВойтиЗарегистрироватьсяОблако для мобильных и веб‑приложенийСайт в облакеАналитика данных в облакеХранение данных в облакеАналитика данных в облакеИнфраструктура для 1С в облакеМиграция IT‑инфраструктуры в облако3D-моделирование и рендерингРазработка и тестирование в облакеEvolution ComputeEvolution Managed KubernetesEvolution Object StorageEvolution Managed PostgreSQL®Evolution Bare MetalEvolution SSH KeysEvolution ImageEvolution DNSEvolution VPCEvolution Load BalancerEvolution Magic RouterEvolution DiskEvolution Container AppsEvolution Artifact RegistryEvolution Managed ArenadataDBEvolution Managed TrinoEvolution Managed SparkEvolution ML InferenceEvolution Distributed TrainEvolution ML FinetuningEvolution NotebooksEvolution TagsEvolution Task HistoryCurator Anti-DDoSCurator Anti‑DDoS+WAFUserGate: виртуальный NGFWStormWall: Anti-DDoSCloud MonitoringCloud LoggingАренда GPUDirect ConnectCDNCloud AdvisorCross-platform connectionAdvanced Object Storage ServiceAdvanced Elastic Cloud ServerAdvanced Relational Database Service for PostgreSQLAdvanced Image Management ServiceAdvanced Auto ScalingAdvanced Enterprise RouterAdvanced Cloud Backup and RecoveryAdvanced Data Warehouse ServiceAdvanced Elastic Volume ServiceAdvanced Cloud Container EngineAdvanced FunctionGraphAdvanced Container Guard ServiceAdvanced Software Repository for ContainerAdvanced Document Database Service with MongoDBAdvanced Relational Database Service for MySQLAdvanced Relational Database Service for SQL ServerAdvanced Server Migration ServiceAdvanced Data Replication ServiceAdvanced API GatewayAdvanced CodeArtsAdvanced Distributed Message Service for KafkaAdvanced Distributed Message Service for RabbitMQAdvanced DataArts InsightAdvanced CloudTableAdvanced MapReduce ServiceAdvanced Cloud Trace ServiceAdvanced Application Performance ManagementAdvanced Identity and Access ManagementAdvanced Enterprise Project Management ServiceVMware: виртуальный ЦОД с GPUVMware: виртуальный ЦОДУдаленные рабочие столы (VDI)VMware: резервное копирование виртуальных машинVMware: резервный ЦОДVMware: резервное копирование в облакоVMware: миграция виртуальных машин
Связаться с нами

Курс Inference

Курс об инференсе и обслуживании ML-моделей в продакшене: batch-, online- и streaming-сценариях, latency, throughput, оптимизации модели, ресурсах и масштабировании
hero_img

Для кого
Что узнаете
Как проходит обучение
Автор курса
Отвечаем на вопросы

Уровень подготовки

Для прохождения курса потребуются знания основ ML и устройства программных сервисов

Бесплатный доступ

Полный комплект учебных материалов курса без скрытых платежей и ограничений

Удобный график

К курсам можно приступить в любой момент и проходить в комфортном для себя темпе

Практический результат

Сможете спроектировать serving path, latency budget и требования к вычислительным ресурсам

Кому подойдет курс

ML-инженерам

Научатся выбирать режим инференса и оптимизировать путь запроса под SLO и стоимость

Бэкенд-инженерам

Разберутся в упаковке модели, API-контрактах, масштабировании и согласовании preprocessing

SRE

Смогут оценивать ресурсы, tail latency, отказоустойчивость и варианты деградации сервиса

Что вы узнаете на курсе

Как выбрать режим инференса

Сравните batch, online и streaming по свежести, задержке, пропускной способности и стоимости

Как ускорить инференс

Научитесь находить узкие места и оценивать batching, caching, quantization и compilation с контролем качества

Как организовать обслуживание модели

Разберете упаковку модели, model servers, API-контракты и одинаковый preprocessing при обучении и инференсе

Как рассчитать ресурсы и масштабирование

Сформируете latency budget, учтете p95/p99, warm-up, concurrency, autoscaling и fallback-сценарии

Как проходит обучение

Пройти курс

Курс доступен сразу после регистрации на платформе LMS. Все уроки и прогресс обучения отражаются в личном кабинете

Автор курса

Курсы Cloud.ru ML System Design

Линейка из 11 курсов о проектировании и разработке ML систем, которые помогут освоить методы создания эффективных и масштабируемых решений в облаке

Курсы Cloud.ru ML System Design

Отвечаем на вопросы

Регистрация на обучение

*
*
*
*
+7
*
*