Быстрый старт сервиса Managed RAG

Эта статья полезна?

Чтобы познакомиться с Managed RAG, создайте базу знаний из текстового файла, используя Object Storage и ML-модели из Foundation Models.

Перед началом работы

Зарегистрируйтесь в личном кабинете Cloud.ru.

Если вы уже зарегистрированы, войдите под своей учетной записью.
Убедитесь, что у вас есть доступ к Foundation Models и Object Storage.
Скачайте текстовый файл faq_products.txt.
Подготовьте документ для базы знаний в Evolution Object Storage.
1. Создайте бакет.
2. Создайте папку rag-quickstart-kb в бакете и загрузите в нее файл faq_products.txt, скачанный ранее.
  
  Список поддерживаемых типов файлов

Создайте базу знаний

Перейдите в AI Factory → Managed RAG.
Нажмите Создать базу знаний.
Введите название и, если необходимо, описание базы знаний.
В поле Путь к папке с документами на S3 выберите папку rag-quickstart-kb в бакете Object Storage, куда вы загрузили файл faq_products.txt.
В поле Расширения документов введите txt — расширение файла, который будет обработан и сохранен в базе знаний.
Нажмите Создать.

При создании базы знаний автоматически будет создан сервисный аккаунт для управления вашими файлами в Object Storage.

Дождитесь, когда завершится индексация и первая версия базы знаний перейдет в статус «Активная».

Получите генеративный ответ по поисковой выдаче

В созданной базе знаний на вкладке Версии рядом с нужной версией нажмите Копировать URL.
Получите токен доступа для отправки запросов.
В терминале выполните следующий код:
curl -X POST "<knowledge_base_public_url>/api/v2/retrieve_generate" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer <access_token>" \
-d '{
"knowledge_base_version": "<knowledge_base_version_id>",
"query": "Что такое сервис Evolution Managed Kubernetes?",
"retrieval_configuration": {
"number_of_results": 3,
"retrieval_type": "SEMANTIC"
},
"generation_configuration": {
"model_name": "t-tech/T-lite-it-1.0",
"model_source": "FOUNDATION_MODELS",
"number_of_chunks_in_context": 3,
"system_prompt": "Вы полезный помощник, который отвечает на вопросы, основываясь на предоставленном контексте."
}
}'
Где:
- <knowledge_base_public_url> — скопированный публичный URL базы знаний;
- <access_token> — полученный токен доступа с помощью Public API Cloud.ru;
- "knowledge_base_version" — идентификатор версии базы знаний. Его можно получить на вкладке Информация нужной версии базы знаний.
- "query" — текст запроса;
- "retrieval_configuration" — настройки поисковой выдачи:
  - "number_of_results" — количество возвращаемых
    чанков
    в поисковой выдаче;
  - "retrieval_type" — тип поиска. В данном случае используется семантический поиск;
- "generation_configuration" — настройки языковой модели из списка параметров:
  - "model_name" — LLM-модель списка поддерживаемых моделей;
  - "model_source" — источник модели. В данном случае используется модель из Foundation Models;
  - "system_prompt" — промпт для LLM-модели;
  - "number_of_chunks_in_context" — количество чанков из поисковой выдачи для контекста LLM.

Что дальше

Попробуйте отправить другие запросы к версии базы знаний или поэкспериментировать в песочнице, получив ответ в чате.

См.также

Где посмотреть, как мой файл разделился на чанки?

Поддержка Юридические документы