Evolution
Тема интерфейса

Создать базу знаний из JSON-файла

В руководстве описан сценарий создания базы знаний с ручной настройкой экстрактора для конкретного JSON-файла.

Общий алгоритм описан в инструкции по созданию базы знаний.

Вы будете использовать следующие сервисы:

  • Evolution Managed RAG — сервис для создания и управления базами знаний, используемыми при генерации ответов языковыми моделями.

  • Evolution Object Storage — объектное хранилище для размещения документов, из которых будет формироваться база знаний.

Шаги:

Перед началом работы

  1. Убедитесь, что у вас есть доступ к Foundation Models и Object Storage.

Шаг 1. Подготовьте контент для базы знаний

Необходим документ для базы знаний в Evolution Object Storage. Для этого:

  1. Создайте папку rag-json-kb в бакете и загрузите в нее файл faq_products.json, скачанный ранее.

Шаг 2. Создайте базу знаний

  1. Перейдите в AI Factory → Managed RAG.

  2. Нажмите Создать базу знаний.

  3. Введите название и, если необходимо, описание базы знаний.

  4. В поле Путь к папке с документами на S3 выберите папку rag-json-kb в бакете Object Storage, куда вы загрузили файл faq_products.json.

  5. В поле Расширения документов введите json — расширение файла, который будет обработан и сохранен в базе знаний.

  6. Активируйте опцию Вручную настроить обработку данных и модель.

    Теперь необходимо настроить экстратор так, чтобы получились чанки вида:

    Продукт: Evolution Foundation Models
    Вопрос: Какой SLA у сервиса Foundation Models?
    Ответ: SLA на сервис Foundation Models составляет 99.9%.
    1. Скопируйте jq-схему и проверьте ее корректность с помощью сайта https://play.jqlang.org:

      .content[]|"Продукт: \(.product); Вопрос: \(.question); Ответ: \(.answer)"
    2. Активируйте опцию Содержимое JSON является строкой, так как в результате парсинга по jq-схеме возвращаются строки.

    3. В поле Splitter выберите RecursiveCharacterTextSplitter — способ разбиения текста на чанки. Остальные поля оставьте без изменений.

    4. Нажмите Продолжить.

    5. Выберите модель-эмбеддер или оставьте по умолчанию.

    6. Нажмите Создать.

Дождитесь, пока база знаний и ее версия перейдет в статус «Активная».

Что дальше

С этим руководством вы создали базу знаний с помощью Managed RAG, загрузили в неё JSON-файлы и настроили.

Узнавайте больше о прикладных сценариях и примерах решения бизнес-задач, получайте навыки управления облаком, выполняя практические руководства.