Оплата за сервис осуществляется по модели «pay-as-you-go» — только за потребляемые ресурсы. Актуальные цены указаны в разделе Тарифы.
Правила тарификации
В сервисе Managed RAG тарифицируются хранение данных в базе знаний и запросы к API базы знаний.
Периодическое списание со счета клиента происходит раз в час.
Особенности тарификации для базы знаний
Во время индексации версии базы знаний также тарифицируются:
хранение объектов и обработка запросов в Object Storage;
обработка запросов к моделям Foundation Models, если модель-эмбеддер, модель-реранкер или LLM-модель выбрана из Foundation Models.
Хранение данных
Единица тарификации: ГБ.
Хранение преобразованных текстовых данных в базе знаний тарифицируется с момента их полной загрузки.
Преобразованные текстовые данные не равны по объему загруженным файлам и составляют объем чанков, полученных после преобразования входных файлов, объем векторов из этих чанков и метаданные.
Запросы к API базы знаний
Единица тарификации: тыс. шт.
Стоимость рассчитывается пропорционально фактическому количеству успешных запросов.
Тарификация сопутствующих сервисов
Хранение объектов и обработка запросов в Object Storage.
Обработка запросов к моделям Foundation Models.
Использованные ресурсы в ML Inference.
Бесплатные объемы (free tier)
Уровень бесплатного пользования в Managed RAG доступен только в рамках использования Object Storage.
Правила расчета стоимости
Стоимость использования сервиса Managed RAG за период рассчитывается следующим образом (числовые значения даны для примера):
8 млн токенов * 0,8 ₽ + 1 ГБ * 10 ч * 1,12 ₽ + 10 тыс. запросов * 0,08 ₽
Где:
8 млн токенов — количество обработанных токенов (млн токенов);
0,8 ₽ — стоимость обработки запросов к Foundation Models (млн токенов);
1 ГБ — размер хранимой информации в версии базы знаний (ГБ);
10 ч — время в часах;
1,12 ₽ — константа, стоимость хранения информации в базе знаний;
10 тыс. запросов — количество обработанных запросов к API базы знаний (тыс. шт.).
0,08 ₽ — константа, стоимость отправки API-запросов к базе знаний;
Пример расчета стоимости
Пользователь создал версию базы знаний с параметрами по умолчанию, состоящую из одного текстового файла длиной 10 000 символов, размером 16,34 КБ. Документ загружен в бакет стандартного класса хранения.
В качестве модели-эмбеддера использовалась модель Qwen/Qwen3-Embedding-0.6B из Foundation Models. Версия базы знаний до полного удаления существовала 30 дней, обработано 1 000 000 запросов к API базы знаний на получение поисковой выдачи, размер каждого пользовательского запроса — 15 токенов.
В этом кейсе использование Object Storage не учитывается, так как пользователь не выходит за рамки уровня бесплатного использования (free tier).
Расчет
После разделения файла на чанки сформировано 10 чанков с суммарным количеством символов 14 444, так как по умолчанию использовалось перекрытие между чанками.
В процессе индексации на векторизацию чанков было обработано 4358 токенов модели Qwen/Qwen3-Embedding-0.6B (тариф 0,4 ₽ за 1 000 000 токенов).
Стоимость обработки запросов к Foundation Models в период индексации:
4358 * 0,4 / 1 000 000 = 0,0017432 ₽
Итоговый размер хранимых преобразованных текстовых данных в версии базы знаний 155 648 Б, или 0,00015565 ГБ.
Стоимость хранения преобразованных текстовых данных за период 30 дней:
0,00015565 * 1,344 * 24 * 30 = 0,150619392 ₽
Стоимость 1 000 000 запросов к API базы знаний на получение поисковой выдачи складывается из стоимости обработки запросов к Foundation Models для векторизации пользовательского запроса и стоимости обработки запросов к API базы знаний:
1 000 000 * ((15 токенов * 0,4 / 1 000 000) + (0.096/1000)) = 6 + 96 = 102 ₽
Итоговая стоимость:
0,0017432 + 0,150619392 + 102 = 102,152362592 ₽