Оплата за сервис осуществляется по модели «pay-as-you-go» — только за потребляемые ресурсы. Актуальные цены указаны в разделе Тарифы.
В сервисе Managed RAG тарифицируются хранение преобразованных текстовых данных в базе знаний и запросы к API базы знаний.
Периодическое списание со счета клиента происходит раз в час.
Во время индексации версии базы знаний также тарифицируются:
хранение объектов и обработка запросов в Object Storage сверх бесплатного объема;
обработка запросов к моделям Foundation Models, если модель-эмбеддер, модель-реранкер или LLM-модель выбрана из Foundation Models.
Единица тарификации: ГБ.
Хранение преобразованных текстовых данных в базе знаний тарифицируется с момента их полной загрузки.
Преобразованные текстовые данные не равны по объему загруженным файлам и составляют объем чанков, полученных после преобразования входных файлов, объем векторов из этих чанков и метаданные.
Единица тарификации: тыс. шт.
Стоимость рассчитывается пропорционально фактическому количеству успешных запросов.
Хранение объектов и обработка запросов в Object Storage.
Обработка запросов к моделям Foundation Models.
Использованные ресурсы в ML Inference.
Стоимость использования сервиса Managed RAG за период рассчитывается по формуле:
\(Price\) | Общая стоимость сервиса. |
\(Tokens\) | Количество обработанных токенов, млн. |
\(Requests\) | Количество обработанных запросов к Foundation Models, млн. |
\(Storage\) | Размер хранимой информации в версии базы знаний, ГБ. |
\(Storage~time\) | Время хранения, часов. |
\(Storage_{const}\) | Константа, стоимость хранения информации в базе знаний. Равна 1,12 ₽. |
\(API~requests\) | Количество обработанных запросов к API базы знаний, тыс. шт. |
\(API~requests_{const}\) | Константа, стоимость отправки API-запросов к базе знаний. Равна 0,08 ₽. |
Пользователь создал версию базы знаний с параметрами по умолчанию, состоящую из одного текстового файла длиной 10 000 символов, размером 16,34 КБ. Документ загружен в бакет стандартного класса хранения.
В качестве модели-эмбеддера использовалась модель Qwen/Qwen3-Embedding-0.6B из Foundation Models. Версия базы знаний до полного удаления существовала 30 дней, обработано 1 000 000 запросов к API базы знаний на получение поисковой выдачи, размер каждого пользовательского запроса — 15 токенов.
В этом кейсе использование Object Storage не учитывается, так как пользователь не выходит за рамки уровня бесплатного использования (free tier).
После разделения файла на чанки сформировано 10 чанков с суммарным количеством символов 14 444, так как по умолчанию использовалось перекрытие между чанками.
В процессе индексации на векторизацию чанков было обработано 4358 токенов модели Qwen/Qwen3-Embedding-0.6B (тариф 0,854 ₽ за 1 000 000 токенов).
Стоимость обработки запросов к Foundation Models в период индексации:
4358 \(\times\) 0,854 \(\div\) 1 000 000 \(=\) 0,003721732 ₽
Итоговый размер хранимых преобразованных текстовых данных в версии базы знаний 155 648 Б, или 0,00015565 ГБ.
Стоимость хранения преобразованных текстовых данных за период 30 дней:
0,00015565 \(\times\) 1,37 \(\times\) 24 \(\times\) 30 \(=\) 0,15353316 ₽
Стоимость 1 000 000 запросов к API базы знаний на получение поисковой выдачи складывается из стоимости обработки запросов к Foundation Models для векторизации пользовательского запроса и стоимости обработки запросов к API базы знаний:
1 000 000 \(\times\) ((15 токенов \(\times\) 0,854 \(\div\) 1 000 000) \(+\) (0.1 \(\div\) 1000)) \(=\) 12,81 \(+\) 100 \(=\) 112,81 ₽``
Итоговая стоимость:
0,003721732 \(+\) 0,15353316 \(+\) 112,81 \(=\) 112,967 ₽