Evolution
Тема интерфейса

Вопросы и ответы

Эта статья полезна?

В статье представлены часто задаваемые вопросы о сервисе и ответы на них.

Как тарифицируется Managed RAG?

Сервис Managed RAG находится в статусе Preview и не тарифицируется.

Тарифицируется только использование Object Storage при превышении бесплатных лимитов, а также использование Foundation Models и ML Inference.

Как загрузить файлы для базы знаний?

Какая векторная база данных используется?

Используется PGVector.

Как управлять квотами?

Для пользователя возможность управлять квотами не предусмотрена.

Если при использовании Managed RAG отобразилось сообщение о превышении квот, обратитесь в техническую поддержку.

Как подключить сервисный аккаунт?

Подключить сервисный аккаунт можно в личном кабинете.

Как выбрать Reranker- и LLM-модели в запросе к версии базы знаний?

Модели Reranker и LLM указываются в теле запроса.

Что такое чанки?

Чанки в технологии RAG (Retrieval-Augmented Generation)— небольшие фрагменты текста, на которые разбивается исходный документ. Каждый чанк представляет собой смысловую часть текста и используется для более точного поиска релевантной информации при формировании ответа модели.

Чанк обычно состоит из токенов — отдельных элементов текста.

Где посмотреть, как мой файл разделился на чанки?

  1. Скопируйте ID базы знаний:

    1. Перейдите в AI Factory → Managed RAG и откройте нужную базу знаний.

    2. Перейдите в нужную версию.

    3. На вкладке Информация выделите и скопируйте часть публичного URL, как показано на скриншоте. Сохраните ее на компьютере, например, в блокнот.

      ../_images/s__kb-id.png
  2. Скопируйте ID версии базы знаний:

    1. Внутри версии базы знаний перейдите на вкладку API.

    2. Скопируйте значение параметра rag_version. Сохраните его на компьютере, например, в блокнот.

  3. Перейдите в бакет Object Storage, который использовался для создания версии базы знаний и вставьте в поисковую строку ID базы знаний.

  4. Перейдите в появившийся каталог и найдите в нем каталог с названием скопированной версии RAG-системы.

  5. Откройте каталог chunks, затем перейдите в каталог с таким же названием, как у каталога-источника данных.

    JSON-файл в нем содержит разделение на чанки.