Создать базу знаний из JSON-файла
В этой статье показано, как создать базу знаний с ручной настройкой экстрактора для конкретного JSON-файла.
Общий алгоритм описан в инструкции по созданию базы знаний.
Перед началом работы
-
Убедитесь, что у вас есть доступ к Foundation Models и Object Storage.
-
Подготовьте документ для базы знаний в Evolution Object Storage.
-
Создайте папку rag-json-kb в бакете и загрузите в нее файл faq_products.json, скачанный ранее.
Создайте базу знаний
-
Перейдите в AI Factory → Managed RAG.
-
Нажмите Создать базу знаний.
-
Введите название и, если необходимо, описание базы знаний.
-
В поле Путь к папке с документами на S3 выберите папку rag-json-kb в бакете Object Storage, куда вы загрузили файл faq_products.json.
-
В поле Расширения документов введите json — расширение файла, который будет обработан и сохранен в базе знаний.
-
Активируйте опцию Вручную настроить обработку данных и модель.
Теперь необходимо настроить экстратор так, чтобы получились чанки вида:
Продукт: Evolution Foundation ModelsВопрос: Какой SLA у сервиса Foundation Models?Ответ: SLA на сервис Foundation Models составляет 99.9%.-
Скопируйте jq-схему и проверьте ее корректность с помощью сайта https://play.jqlang.org:
.content[]|"Продукт: \(.product); Вопрос: \(.question); Ответ: \(.answer)" -
Активируйте опцию Содержимое JSON является строкой, так как в результате парсинга по jq-схеме возвращаются строки.
-
В поле Splitter выберите RecursiveCharacterTextSplitter — способ разбиения текста на чанки. Остальные поля оставьте без изменений.
-
Нажмите Продолжить.
-
Выберите модель-эмбеддер или оставьте по умолчанию.
-
Нажмите Создать.
-
Дождитесь, пока база знаний и ее версия перейдет в статус «Активная».
- Перед началом работы
- Создайте базу знаний