Evolution
Тема интерфейса

Вопросы и ответы

В статье представлены часто задаваемые вопросы о сервисе и ответы на них.

Как тарифицируется Managed RAG?

Сервис Managed RAG находится в статусе Preview и не тарифицируется.

Тарифицируется только использование Object Storage при превышении бесплатных лимитов.

Как загрузить файлы для базы знаний?

Какая векторная база данных используется?

Используется PGVector.

Как управлять квотами?

Для пользователя возможность управлять квотами не предусмотрена.

Если при использовании Managed RAG отобразилось сообщение о превышении квот, обратитесь в техническую поддержку.

Как подключить сервисный аккаунт?

Подключить сервисный аккаунт можно в личном кабинете.

Где посмотреть, как мои данные были разделены на чанки?

Промежуточные этапы обработки ваших данных сохраняются в ваш бакет в Object Storage.

Как выбрать Reranker- и LLM-модели в запросе к версии базы знаний?

Модели Reranker и LLM указываются в теле запроса.

Что такое чанки?

Чанки в технологии RAG (Retrieval-Augmented Generation)— небольшие фрагменты текста, на которые разбивается исходный документ. Каждый чанк представляет собой смысловую часть текста и используется для более точного поиска релевантной информации при формировании ответа модели.

Чанк обычно состоит из токенов — отдельных элементов текста.

Где посмотреть, как мой файл разделился на чанки?

  1. Скопируйте ID базы знаний:

    1. Перейдите в AI Factory → Managed RAG и откройте нужную базу знаний.

    2. Перейдите в нужную версию.

    3. На вкладке Информация выделите и скопируйте часть публичного URL, как показано на скриншоте. Сохраните ее на компьютере, например, в блокнот.

      ../_images/s__kb-id.png
  2. Скопируйте ID версии базы знаний:

    1. Внутри версии базы знаний перейдите на вкладку API.

    2. Скопируйте значение параметра rag_version. Сохраните его на компьютере, например, в блокнот.

  3. Перейдите в бакет Object Storage, который использовался для создания версии базы знаний и вставьте в поисковую строку ID базы знаний.

  4. Перейдите в появившийся каталог и найдите в нем каталог с названием скопированной версии RAG-системы.

  5. Откройте каталог chunks, затем перейдите в каталог с таким же названием, как у каталога-источника данных.

    JSON-файл в нем содержит разделение на чанки.