В руководстве описан сценарий создания базы знаний с ручной настройкой экстрактора для конкретного JSON-файла.
Общий алгоритм описан в инструкции по созданию базы знаний.
Вы будете использовать следующие сервисы:
Evolution Managed RAG — сервис для создания и управления базами знаний, используемыми при генерации ответов языковыми моделями.
Evolution Object Storage — объектное хранилище для размещения документов, из которых будет формироваться база знаний.
Шаги:
Перед началом работы
Убедитесь, что у вас есть доступ к Foundation Models и Object Storage.
Шаг 1. Подготовьте контент для базы знаний
Необходим документ для базы знаний в Evolution Object Storage. Для этого:
Создайте папку rag-json-kb в бакете и загрузите в нее файл faq_products.json, скачанный ранее.
Шаг 2. Создайте базу знаний
Перейдите в AI Factory → Managed RAG.
Нажмите Создать базу знаний.
Введите название и, если необходимо, описание базы знаний.
В поле Путь к папке с документами на S3 выберите папку rag-json-kb в бакете Object Storage, куда вы загрузили файл faq_products.json.
В поле Расширения документов введите json — расширение файла, который будет обработан и сохранен в базе знаний.
Активируйте опцию Вручную настроить обработку данных и модель.
Теперь необходимо настроить экстратор так, чтобы получились чанки вида:
Продукт: Evolution Foundation ModelsВопрос: Какой SLA у сервиса Foundation Models?Ответ: SLA на сервис Foundation Models составляет 99.9%.Скопируйте jq-схему и проверьте ее корректность с помощью сайта https://play.jqlang.org:
.content[]|"Продукт: \(.product); Вопрос: \(.question); Ответ: \(.answer)"Активируйте опцию Содержимое JSON является строкой, так как в результате парсинга по jq-схеме возвращаются строки.
В поле Splitter выберите RecursiveCharacterTextSplitter — способ разбиения текста на чанки. Остальные поля оставьте без изменений.
Нажмите Продолжить.
Выберите модель-эмбеддер или оставьте по умолчанию.
Нажмите Создать.
Дождитесь, пока база знаний и ее версия перейдет в статус «Активная».
Что дальше
С этим руководством вы создали базу знаний с помощью Managed RAG, загрузили в неё JSON-файлы и настроили.
Теперь можно отправлять API-запросы к версии базы знаний.
Узнавайте больше о прикладных сценариях и примерах решения бизнес-задач, получайте навыки управления облаком, выполняя практические руководства.
- Перед началом работы
- Шаг 1. Подготовьте контент для базы знаний
- Шаг 2. Создайте базу знаний
- Что дальше