Облачная платформаEvolution

Вопросы и ответы про сервис Managed RAG


В статье представлены часто задаваемые вопросы о сервисе и ответы на них.

Как тарифицируется Managed RAG?

Оплата за сервис осуществляется по модели «pay-as-you-go» — только за потребляемые ресурсы.

Подробнее с правилами тарификации вы можете ознакомиться в разделе Тарификация.

Как загрузить файлы для базы знаний?

Какая векторная база данных используется?

Используется PGVector.

Как управлять квотами?

Для пользователя возможность управлять квотами не предусмотрена.

Если при использовании Managed RAG отобразилось сообщение о превышении квот, обратитесь в техническую поддержку.

Как подключить сервисный аккаунт?

Подключить сервисный аккаунт можно в личном кабинете.

Как выбрать Reranker- и LLM-модели в запросе к версии базы знаний?

Модели Reranker и LLM указываются в теле запроса.

Что такое чанки?

Чанки в технологии RAG (Retrieval-Augmented Generation)— небольшие фрагменты текста, на которые разбивается исходный документ. Каждый чанк представляет собой смысловую часть текста и используется для более точного поиска релевантной информации при формировании ответа модели.

Чанк обычно состоит из токенов — отдельных элементов текста.