Перед началом использования Managed RAG ознакомьтесь с особенностями сервиса и ограничениями.
Квоты
В сервисе Managed RAG действует
на количество активных баз знаний в проекте:Название квоты | Значение |
|---|---|
Количество активных баз знаний | 1 000 |
Для увеличения квот обратитесь в техническую поддержку.
Ограничения
Ограничения для файлов
Пользовательские файлы, на основе которых создаются базы знаний, имеют следующие ограничения:
максимальный размер файла — 25 МБ;
для PDF-файлов нет поддержки OCR.
Ограничение для источников модели
При создании инференса для базы знаний нужно правильно задать параметры:
Runtime:
«vLLM» — для любых типов моделей;
«vLLM» или «SGLang» — только для LLM.
Задача ML-модели:
«Embedding» — для модели-эмбеддера;
«Score» — для модели-реранкера;
«Generate» — для LLM.