Облачная платформаEvolution

Ограничения и особенности сервиса Managed RAG

Эта статья полезна?

Перед началом использования Managed RAG ознакомьтесь с особенностями сервиса и ограничениями.

Квоты

В сервисе Managed RAG действует

на количество активных баз знаний в проекте:

Название квоты

Значение

Количество активных баз знаний

1 000

Для увеличения квот обратитесь в техническую поддержку.

Ограничения

Ограничения для файлов

Пользовательские файлы, на основе которых создаются базы знаний, имеют следующие ограничения:

  • максимальный размер файла — 25 МБ;

  • для PDF-файлов нет поддержки OCR.

Ограничение для источников модели

При создании инференса для базы знаний нужно правильно задать параметры:

  • Runtime:

    • «vLLM» — для любых типов моделей;

    • «vLLM» или «SGLang» — только для LLM.

  • Задача ML-модели:

    • «Embedding» — для модели-эмбеддера;

    • «Score» — для модели-реранкера;

    • «Generate» — для LLM.