Облачная платформаEvolution

Тарификация сервиса Managed RAG

Эта статья полезна?

Оплата за сервис осуществляется по модели «pay-as-you-go» — только за потребляемые ресурсы. Актуальные цены указаны в разделе Тарифы.

Правила тарификации

В сервисе Managed RAG тарифицируются хранение преобразованных текстовых данных в базе знаний и запросы к API базы знаний.

Периодическое списание со счета клиента происходит раз в час.

Особенности тарификации для базы знаний

Во время индексации версии базы знаний также тарифицируются:

хранение объектов и обработка запросов в Object Storage;
обработка запросов к моделям Foundation Models, если модель-эмбеддер, модель-реранкер или LLM-модель выбрана из Foundation Models.

Хранение данных

Единица тарификации: ГБ.

Хранение преобразованных текстовых данных в базе знаний тарифицируется с момента их полной загрузки.

Преобразованные текстовые данные не равны по объему загруженным файлам и составляют объем чанков, полученных после преобразования входных файлов, объем векторов из этих чанков и метаданные.

Запросы к API базы знаний

Единица тарификации: тыс. шт.

Стоимость рассчитывается пропорционально фактическому количеству успешных запросов.

Тарификация сопутствующих сервисов

Хранение объектов и обработка запросов в Object Storage.
Обработка запросов к моделям Foundation Models.
Использованные ресурсы в ML Inference.

См.также

Бесплатные объемы (free tier)

Уровень бесплатного пользования в Managed RAG доступен только в рамках использования Object Storage.

Правила расчета стоимости

Стоимость использования сервиса Managed RAG за период рассчитывается следующим образом (числовые значения даны для примера):

8 млн токенов * 0,8 ₽ + 1 ГБ * 10 ч * 1,12 ₽ + 10 тыс. запросов * 0,08 ₽

Где:

8 млн токенов — количество обработанных токенов (млн токенов);
0,8 ₽ — стоимость обработки запросов к Foundation Models (млн токенов);
1 ГБ — размер хранимой информации в версии базы знаний (ГБ);
10 ч — время в часах;
1,12 ₽ — константа, стоимость хранения информации в базе знаний;
10 тыс. запросов — количество обработанных запросов к API базы знаний (тыс. шт.).
0,08 ₽ — константа, стоимость отправки API-запросов к базе знаний;

Пример расчета стоимости

Пользователь создал версию базы знаний с параметрами по умолчанию, состоящую из одного текстового файла длиной 10 000 символов, размером 16,34 КБ. Документ загружен в бакет стандартного класса хранения.

В качестве модели-эмбеддера использовалась модель Qwen/Qwen3-Embedding-0.6B из Foundation Models. Версия базы знаний до полного удаления существовала 30 дней, обработано 1 000 000 запросов к API базы знаний на получение поисковой выдачи, размер каждого пользовательского запроса — 15 токенов.

В этом кейсе использование Object Storage не учитывается, так как пользователь не выходит за рамки уровня бесплатного использования (free tier).

Расчет

После разделения файла на чанки сформировано 10 чанков с суммарным количеством символов 14 444, так как по умолчанию использовалось перекрытие между чанками.

В процессе индексации на векторизацию чанков было обработано 4358 токенов модели Qwen/Qwen3-Embedding-0.6B (тариф 0,4 ₽ за 1 000 000 токенов).

Стоимость обработки запросов к Foundation Models в период индексации:

4358 * 0,4 / 1 000 000 = 0,0017432 ₽

Итоговый размер хранимых преобразованных текстовых данных в версии базы знаний 155 648 Б, или 0,00015565 ГБ.

Стоимость хранения преобразованных текстовых данных за период 30 дней:

0,00015565 * 1,344 * 24 * 30 = 0,150619392 ₽

Стоимость 1 000 000 запросов к API базы знаний на получение поисковой выдачи складывается из стоимости обработки запросов к Foundation Models для векторизации пользовательского запроса и стоимости обработки запросов к API базы знаний:

1 000 000 * ((15 токенов * 0,4 / 1 000 000) + (0.096/1000)) = 6 + 96 = 102 ₽

Итоговая стоимость:

0,0017432 + 0,150619392 + 102 = 102,152362592 ₽

Предыдущая статья

Поддерживаемые модели

Следующая статья

Решение проблем в сервисе Managed RAG

Эта статья полезна?

Поддержка Юридические документы