Обзор Managed RAG
Managed RAG — сервис для запуска Retrieval Augmented Generation (RAG) систем, основанных на ваших данных.
Сервис основывается на технологии Retrieval Augmented Generation (RAG), при использовании которой пользователь пишет запрос к LLM, к нему программно «подмешивается» дополнительная информация из внешних источников (базы знаний) и передается на вход языковой модели. Другими словами, пользователь добавляет в контекст запроса к языковой модели дополнительную информацию, на основе которой она может дать более полный и точный ответ.
- Фактологически точный генеративный ответ
- Доступность и простота использования
- Экономичное использование ресурсов и поддержка моделей из HuggingFace
Managed RAG извлекает и анализирует данные из вашей базы знаний, предоставляя актуальную и точную информацию для генерации контента с помощью больших языковых моделей.
Нет необходимости самостоятельно подбирать векторную базу данных и разворачивать RAG-систему — используйте готовые протестированные инструменты в Managed RAG.
Благодаря интеграции с сервисами ML Inference и Foundation Models.
Сценарии использования Managed RAG
Чат-бот поддержка клиентов на основе LLM.
Расширение функциональности агентных систем.
Пример: агент для формирования отчета по заданной теме.
Векторный и полнотекстовый поиск.
Пример: поиск по каталогу товаров, который учитывает не только ключевые слова, но и семантику запроса.
Суммаризация поисковой выдачи.
Пример: получение краткого ответа на пользовательский запрос по поисковой выдаче.
- Сценарии использования Managed RAG