Облачная платформаEvolution

Индексация


Индексация — это статус и процесс обработки данных при создании новой версии базы знаний. Она состоит из шагов:

  1. Документы загружаются из источника на S3.

  2. Содержимое обрабатывается экстракторами и разделяется на чанки.

  3. Чанки преобразуются в векторы.

  4. Векторы загружаются в векторную базу данных.

При выпуске версии генерируется отдельный набор токенов, векторов и метаданных, которые позволяют быстро находить релевантные фрагменты. Индекс фиксирует структуру данных в том виде, в котором они были на момент публикации.

Переиндексация

В Managed RAG пользователям доступна переиндексация как базы знаний, так и конкретной версии. При переиндексации создается новая версия базы знаний, отличаются исходные данные:

  • при переиндексации базы знаний — версия создается на основе последней актуальной версии;

  • при переиндексации конкретной версии — версия создается на основе этой версии.

Примечание

Если версия находится в статусе «Индексация» более недели, обратитесь в техническую поддержку.