Облачная платформаEvolution

Быстрый старт сервиса Managed RAG

Эта статья полезна?

Чтобы познакомиться с Managed RAG, создайте базу знаний из текстового файла, используя Object Storage и ML-модели из Foundation Models.

Перед началом работы

  1. Если вы уже зарегистрированы, войдите под своей учетной записью.

  2. Убедитесь, что у вас есть доступ к Foundation Models и Object Storage.

  3. Подготовьте документ для базы знаний в Evolution Object Storage.

    1. Создайте папку rag-quickstart-kb в бакете и загрузите в нее файл faq_products.txt, скачанный ранее.

Создайте базу знаний

  1. Перейдите в AI Factory → Managed RAG.

  2. Нажмите Создать базу знаний.

  3. Введите название и, если необходимо, описание базы знаний.

  4. В поле Путь к папке с документами на S3 выберите папку rag-quickstart-kb в бакете Object Storage, куда вы загрузили файл faq_products.txt.

  5. В поле Расширения документов введите txt — расширение файла, который будет обработан и сохранен в базе знаний.

  6. Нажмите Создать.

При создании базы знаний автоматически будет создан сервисный аккаунт для управления вашими файлами в Object Storage.

Дождитесь, когда завершится индексация и первая версия базы знаний перейдет в статус «Активная».

Получите генеративный ответ по поисковой выдаче

  1. В созданной базе знаний на вкладке Версии рядом с нужной версией нажмите Копировать URL.

  2. В терминале выполните следующий код:


    curl -X POST "<knowledge_base_public_url>/api/v2/retrieve_generate" \
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer <access_token>" \
    -d '{
    "knowledge_base_version": "<knowledge_base_version_id>",
    "query": "Что такое сервис Evolution Managed Kubernetes?",
    "retrieval_configuration": {
    "number_of_results": 3,
    "retrieval_type": "SEMANTIC"
    },
    "generation_configuration": {
    "model_name": "t-tech/T-lite-it-1.0",
    "model_source": "FOUNDATION_MODELS",
    "number_of_chunks_in_context": 3,
    "system_prompt": "Вы полезный помощник, который отвечает на вопросы, основываясь на предоставленном контексте."
    }
    }'

    Где:

    • <knowledge_base_public_url> — скопированный публичный URL базы знаний;

    • <access_token> — полученный токен доступа с помощью Public API Cloud.ru;

    • "knowledge_base_version" — идентификатор версии базы знаний. Его можно получить на вкладке Информация нужной версии базы знаний.

    • "query" — текст запроса;

    • "retrieval_configuration" — настройки поисковой выдачи:

      • "number_of_results" — количество возвращаемых

        в поисковой выдаче;

      • "retrieval_type" — тип поиска. В данном случае используется семантический поиск;

    • "generation_configuration" — настройки языковой модели из списка параметров:

      • "model_source" — источник модели. В данном случае используется модель из Foundation Models;

      • "system_prompt" — промпт для LLM-модели;

      • "number_of_chunks_in_context" — количество чанков из поисковой выдачи для контекста LLM.

Что дальше

Попробуйте отправить другие запросы к версии базы знаний или поэкспериментировать в песочнице, получив ответ в чате.