Evolution
Тема интерфейса

Создать базу знаний из JSON-файла

В этой статье показано, как создать базу знаний с ручной настройкой экстрактора для конкретного JSON-файла.

Общий алгоритм описан в инструкции по созданию базы знаний.

Перед началом работы

  1. Убедитесь, что у вас есть доступ к Foundation Models и Object Storage.

  2. Подготовьте документ для базы знаний в Evolution Object Storage.

    1. Создайте папку rag-json-kb в бакете и загрузите в нее файл faq_products.json, скачанный ранее.

Создайте базу знаний

  1. Перейдите в AI Factory → Managed RAG.

  2. Нажмите Создать базу знаний.

  3. Введите название и, если необходимо, описание базы знаний.

  4. В поле Путь к папке с документами на S3 выберите папку rag-json-kb в бакете Object Storage, куда вы загрузили файл faq_products.json.

  5. В поле Расширения документов введите json — расширение файла, который будет обработан и сохранен в базе знаний.

  6. Активируйте опцию Вручную настроить обработку данных и модель.

    Теперь необходимо настроить экстратор так, чтобы получились чанки вида:

    Продукт: Evolution Foundation Models
    Вопрос: Какой SLA у сервиса Foundation Models?
    Ответ: SLA на сервис Foundation Models составляет 99.9%.
    1. Скопируйте jq-схему и проверьте ее корректность с помощью сайта https://play.jqlang.org:

      .content[]|"Продукт: \(.product); Вопрос: \(.question); Ответ: \(.answer)"
    2. Активируйте опцию Содержимое JSON является строкой, так как в результате парсинга по jq-схеме возвращаются строки.

    3. В поле Splitter выберите RecursiveCharacterTextSplitter — способ разбиения текста на чанки. Остальные поля оставьте без изменений.

    4. Нажмите Продолжить.

    5. Выберите модель-эмбеддер или оставьте по умолчанию.

    6. Нажмите Создать.

Дождитесь, пока база знаний и ее версия перейдет в статус «Активная».