Перед началом использования Managed RAG ознакомьтесь с особенностями сервиса и ограничениями.
Квоты
В сервисе Managed RAG действует
на количество активных баз знаний в проекте:Название квоты | Значение |
|---|---|
Количество активных баз знаний | 1 000 |
Для увеличения квот обратитесь в техническую поддержку.
Ограничения
Ограничения для файлов
Пользовательские файлы, на основе которых создаются базы знаний, имеют следующие ограничения:
максимальный размер файла — 25 МБ;
для PDF-файлов нет поддержки OCR.
Ограничение для источников модели
При создании базы знаний или ее версии можно выбрать только инференсы, которые собраны под vLLM Runtime.
В инференсе, который используете для создания базы знаний, нужно правильно задать параметр Задача ML-модели. Ниже перечислены подходящие значения:
для модели-эмбеддера — «Embedding»;
для модели-реранкера — «Score»;
для LLM — «Generate».