Облачная платформаEvolution

Тарификация сервиса Managed RAG


Оплата за сервис осуществляется по модели «pay-as-you-go» — только за потребляемые ресурсы. Актуальные цены указаны в разделе Тарифы.

Правила тарификации

В сервисе Managed RAG тарифицируются хранение преобразованных текстовых данных в базе знаний и запросы к API базы знаний.

Периодическое списание со счета клиента происходит раз в час.

Особенности тарификации для базы знаний

Во время индексации версии базы знаний также тарифицируются:

  • хранение объектов и обработка запросов в Object Storage сверх бесплатного объема;

  • обработка запросов к моделям Foundation Models, если модель-эмбеддер, модель-реранкер или LLM-модель выбрана из Foundation Models.

Хранение данных

Единица тарификации: ГБ.

Хранение преобразованных текстовых данных в базе знаний тарифицируется с момента их полной загрузки.

Преобразованные текстовые данные не равны по объему загруженным файлам и составляют объем чанков, полученных после преобразования входных файлов, объем векторов из этих чанков и метаданные.

Запросы к API базы знаний

Единица тарификации: тыс. шт.

Стоимость рассчитывается пропорционально фактическому количеству успешных запросов.

Тарификация сопутствующих сервисов

  • Хранение объектов и обработка запросов в Object Storage.

  • Обработка запросов к моделям Foundation Models.

  • Использованные ресурсы в ML Inference.

Правила расчета стоимости

Стоимость использования сервиса Managed RAG за период рассчитывается по формуле:

\[Price = Tokens \times Requests + Storage \times Storage~time \times Storage_{const} + API~requests \times API~requests_{const}\]

\(Price\)

Общая стоимость сервиса.

\(Tokens\)

Количество обработанных токенов, млн.

\(Requests\)

Количество обработанных запросов к Foundation Models, млн.

\(Storage\)

Размер хранимой информации в версии базы знаний, ГБ.

\(Storage~time\)

Время хранения, часов.

\(Storage_{const}\)

Константа, стоимость хранения информации в базе знаний. Равна 1,12 ₽.

\(API~requests\)

Количество обработанных запросов к API базы знаний, тыс. шт.

\(API~requests_{const}\)

Константа, стоимость отправки API-запросов к базе знаний. Равна 0,08 ₽.

Пример расчета стоимости

Пользователь создал версию базы знаний с параметрами по умолчанию, состоящую из одного текстового файла длиной 10 000 символов, размером 16,34 КБ. Документ загружен в бакет стандартного класса хранения.

В качестве модели-эмбеддера использовалась модель Qwen/Qwen3-Embedding-0.6B из Foundation Models. Версия базы знаний до полного удаления существовала 30 дней, обработано 1 000 000 запросов к API базы знаний на получение поисковой выдачи, размер каждого пользовательского запроса — 15 токенов.

В этом кейсе использование Object Storage не учитывается, так как пользователь не выходит за рамки уровня бесплатного использования (free tier).

Расчет

После разделения файла на чанки сформировано 10 чанков с суммарным количеством символов 14 444, так как по умолчанию использовалось перекрытие между чанками.

В процессе индексации на векторизацию чанков было обработано 4358 токенов модели Qwen/Qwen3-Embedding-0.6B (тариф 0,854 ₽ за 1 000 000 токенов).

Стоимость обработки запросов к Foundation Models в период индексации:

4358 \(\times\) 0,854 \(\div\) 1 000 000 \(=\) 0,003721732 ₽

Итоговый размер хранимых преобразованных текстовых данных в версии базы знаний 155 648 Б, или 0,00015565 ГБ.

Стоимость хранения преобразованных текстовых данных за период 30 дней:

0,00015565 \(\times\) 1,37 \(\times\) 24 \(\times\) 30 \(=\) 0,15353316 ₽

Стоимость 1 000 000 запросов к API базы знаний на получение поисковой выдачи складывается из стоимости обработки запросов к Foundation Models для векторизации пользовательского запроса и стоимости обработки запросов к API базы знаний:

1 000 000 \(\times\) ((15 токенов \(\times\) 0,854 \(\div\) 1 000 000) \(+\) (0.1 \(\div\) 1000)) \(=\) 12,81 \(+\) 100 \(=\) 112,81 ₽``

Итоговая стоимость:

0,003721732 \(+\) 0,15353316 \(+\) 112,81 \(=\) 112,967 ₽