Облачная платформаEvolution

Создать маршрутизатор


Внимание

Для создания маршрутизатора:

  1. На верхней панели слева нажмите Кнопка с изображением девяти точек и перейдите в AI Factory → ML Inference → Маршрутизаторы.

  2. Нажмите Создать маршрутизатор.

  3. В поле Название укажите название маршрутизатора или оставьте указанное по умолчанию.

  4. Выберите AI-модель из Foundation Models.

  5. Выберите инференс Model RUN или нажмите Создать инференс для создания нового.

    Для выбора доступны инференсы со следующими параметрами:

    ../_images/s__guides__router-create3.webp
  6. Нажмите Продолжить.

  7. Настройте опции масштабирования для модели из Foundation Models:

    • Мягкое ограничение — порог, при достижении которого система начинает мониторить нагрузку.

    • Жесткое ограничение — порог, после которого трафик переводится на пользовательский инференс.

  8. Настройте опции масштабирования для инференса Model RUN:

    • Мягкое ограничение — порог, при достижении которого система начинает мониторить нагрузку.

    • Жесткое ограничение — порог, после которого весь трафик переводится на инференс Model RUN.

    • Target burst capacity — максимальное количество реплик Model RUN, до которого можно увеличить масштабирование при резком росте нагрузки.

  9. Нажмите Создать.

    ../_images/s__guides__router-create2.webp

После успешного создания и запуска маршрутизатора в штатном режиме все запросы обрабатываются через Foundation Models. Когда нагрузка на Foundation Models превышает установленные лимиты, трафик автоматически переключается на указанный инференс Model RUN.