Облачная платформаEvolution

Вопросы и ответы про сервис Managed RAG

Эта статья полезна?

В статье представлены часто задаваемые вопросы о сервисе и ответы на них.

Как тарифицируется Managed RAG?

Оплата за сервис осуществляется по модели «pay-as-you-go» — только за потребляемые ресурсы.

Подробнее с правилами тарификации вы можете ознакомиться в разделе Тарификация.

Как загрузить файлы для базы знаний?

Какая векторная база данных используется?

Используется PGVector.

Как управлять квотами?

Для пользователя возможность управлять квотами не предусмотрена.

Если при использовании Managed RAG отобразилось сообщение о превышении квот, обратитесь в техническую поддержку.

Как подключить сервисный аккаунт?

Подключить сервисный аккаунт можно в личном кабинете.

Как выбрать Reranker- и LLM-модели в запросе к версии базы знаний?

Модели Reranker и LLM указываются в теле запроса.

Что такое чанки?

в технологии RAG (Retrieval-Augmented Generation)— небольшие фрагменты текста, на которые разбивается исходный документ. Каждый чанк представляет собой смысловую часть текста и используется для более точного поиска релевантной информации при формировании ответа модели.

Чанк обычно состоит из токенов — отдельных элементов текста.

Где посмотреть, как мой файл разделился на чанки?

  1. Скопируйте ID базы знаний:

    1. Перейдите в AI Factory → Managed RAG и откройте нужную базу знаний.

    2. Перейдите в нужную версию.

    3. На вкладке Информация выделите и скопируйте часть публичного URL, как показано на скриншоте. Сохраните ее на компьютере, например, в блокнот.

      ../_images/s__kb-id.png
  2. Скопируйте ID версии базы знаний:

    1. Внутри версии базы знаний перейдите на вкладку API.

    2. Скопируйте значение параметра rag_version. Сохраните его на компьютере, например, в блокнот.

  3. Перейдите в бакет Object Storage, который использовался для создания версии базы знаний и вставьте в поисковую строку ID базы знаний.

  4. Перейдите в появившийся каталог и найдите в нем каталог с названием скопированной версии RAG-системы.

  5. Откройте каталог chunks, затем перейдите в каталог с таким же названием, как у каталога-источника данных.

    JSON-файл в нем содержит разделение на чанки.