В статье представлены часто задаваемые вопросы о сервисе и ответы на них.
Оплата за сервис осуществляется по модели «pay-as-you-go» — только за потребляемые ресурсы.
Подробнее с правилами тарификации вы можете ознакомиться в разделе Тарификация.
Перед созданием базы знаний загрузите ваши файлы в бакет в Evolution Object Storage.
Используется PGVector.
Для пользователя возможность управлять квотами не предусмотрена.
Если при использовании Managed RAG отобразилось сообщение о превышении квот, обратитесь в техническую поддержку.
Подключить сервисный аккаунт можно в личном кабинете.
Модели Reranker и LLM указываются в теле запроса.
Чанки в технологии RAG (Retrieval-Augmented Generation)— небольшие фрагменты текста, на которые разбивается исходный документ. Каждый чанк представляет собой смысловую часть текста и используется для более точного поиска релевантной информации при формировании ответа модели.
Чанк обычно состоит из токенов — отдельных элементов текста.