Версия базы знаний содержит:
настройки экстракторов — параметры обработки документов (размер чанков, методы очистки и т.д.);
чанки — фрагменты исходных документов после обработки;
векторы — числовые представления чанков для семантического поиска;
метаданные — дополнительная информация о документах и фрагментах.
При каждом обновлении базы создается новая версия, чтобы LLM-модель могла обращаться к однородному и согласованному набору данных. Таким образом, версия фиксирует состояние информации в конкретный момент времени.
Версионирование упрощает контроль качества: можно сравнивать ответы от разных версий базы и быстро находить отклонения. Версии позволяют разработчикам протестировать, как изменения влияют на ответы LLM-модели, и сохранить при этом предыдущий вид базы. Это делает процесс отладки предсказуемым и прозрачным.
Для возвращения к прошлому виду базы достаточно изменить в поисковом запросе идентификатор версии. Вручную восстанавливать отдельные файлы не требуется. Такой подход экономит время и снижает риск ошибок при восстановлении. Управление версиями базы знаний считается базовым элементом в Managed RAG.