nav-img
Evolution

Обзор Managed RAG

Managed RAG — сервис для запуска Retrieval Augmented Generation (RAG) систем, основанных на ваших данных.

Сервис основывается на технологии Retrieval Augmented Generation (RAG), при использовании которой пользователь пишет запрос к LLM, к нему программно «подмешивается» дополнительная информация из внешних источников (базы знаний) и передается на вход языковой модели. Другими словами, пользователь добавляет в контекст запроса к языковой модели дополнительную информацию, на основе которой она может дать более полный и точный ответ.

Фактологически точный генеративный ответ

Managed RAG извлекает и анализирует данные из вашей базы знаний, предоставляя актуальную и точную информацию для генерации контента с помощью больших языковых моделей.

Доступность и простота использования

Нет необходимости самостоятельно подбирать векторную базу данных и разворачивать RAG-систему — используйте готовые протестированные инструменты в Managed RAG.

Экономичное использование ресурсов и поддержка моделей из HuggingFace

Благодаря интеграции с сервисами ML Inference и Foundation Models.

Сценарии использования Managed RAG

  • Чат-бот поддержка клиентов на основе LLM.

  • Расширение функциональности агентных систем.

    Пример: агент для формирования отчета по заданной теме.

  • Векторный и полнотекстовый поиск.

    Пример: поиск по каталогу товаров, который учитывает не только ключевые слова, но и семантику запроса.

  • Суммаризация поисковой выдачи.

    Пример: получение краткого ответа на пользовательский запрос по поисковой выдаче.