Облачная платформаEvolution

Ограничения и особенности сервиса Managed RAG

Эта статья полезна?

Перед началом использования Managed RAG ознакомьтесь с особенностями сервиса и ограничениями.

Квоты

В сервисе Managed RAG действует

на количество активных баз знаний в проекте:

Название квоты

Значение

Количество активных баз знаний

1 000

Для увеличения квот обратитесь в техническую поддержку.

Ограничения

Ограничения для файлов

Пользовательские файлы, на основе которых создаются базы знаний, имеют следующие ограничения:

  • максимальный размер файла — 25 МБ;

  • для PDF-файлов нет поддержки OCR.

Ограничение для источников модели

При создании базы знаний или ее версии можно выбрать только инференсы, которые собраны под vLLM Runtime.

В инференсе, который используете для создания базы знаний, нужно правильно задать параметр Задача ML-модели. Ниже перечислены подходящие значения:

  • для модели-эмбеддера — «Embedding»;

  • для модели-реранкера — «Score»;

  • для LLM — «Generate».