/ DOCS
Облачная платформа
Evolution
Тема интерфейса
Поиск
/
ML Inference
Обзор ML Inference
Быстрый старт
Управление доступом
Инструкции
Концепции
Тарификация
Решение проблем
Вопросы и ответы
Товарные знаки
Обратиться в поддержку
›
...
Главная
Главная
В эт...
В этом документе
В этом документе
Обзор ML Inference
Что нового
Быстрый старт
Управление доступом
Инструкции
Каталог моделей
Model RUN
Создать инференс
Вызвать модель
Редактировать параметры модели
Посмотреть логи
Остановить и запустить инференс
Удалить инференс
Docker RUN
Создать инференс
Вызвать пользовательскую модель
Редактировать параметры пользовательской модели
Посмотреть логи
Остановить и запустить инференс
Удалить инференс
Концепции
Типы моделей для инференса
Большие текстовые модели (LLM)
Текстовые модели (TGI)
Диффузионные модели
Модели-трансформеры
Статусы инференса
Масштабирование инференса
Аудит-логирование
Сервисный мониторинг ML Inference
Системные метрики ML Inference
Мониторинг Model RUN Transformers
Мониторинг Model RUN Diffusers
Мониторинг Model RUN vLLM
Тарификация
Решение проблем
Ошибка 502 при старте из статуса «Ожидание запроса»
Циклический старт в Ollama
Вопросы и ответы
Какие видеокарты поддерживаются?
Как остановить тарификацию сервиса?
Как управлять квотами?
Как подключить сервисный аккаунт?
Товарные знаки
Обратиться в поддержку
Поддержка
Юридические документы
© 2025 Cloud.ru