Облачная платформаAdvanced

Функции улучшения поиска для кластеров OpenSearch

Эта статья полезна?
Язык статьи: Русский
Показать оригинал
Страница переведена автоматически и может содержать неточности. Рекомендуем сверяться с английской версией.

По сравнению с открытым OpenSearch, кластеры OpenSearch в CSS имеют множество улучшенных функций. Таблица 1 Перечисляет эти улучшенные функции и соответствующие версии кластеров.

Таблица 1 Функции улучшения поиска для кластеров OpenSearch

Улучшенная функция

Описание

Версия кластера

Подробности

Векторный поиск

Неcтруктурированные данные, такие как изображения, видео и языковые корпусы, преобразуются в векторы, которые ищутся по сходству с использованием точного или приближённого алгоритма ближайших соседей.

OpenSearch 1.3.6, OpenSearch 2.19.0

Разделение хранилища и вычислений

Горячие данные, которые часто запрашиваются, хранятся в высокопроизводительных носителях, в то время как холодные данные, которые запрашиваются редко, переносятся в недорогие носители — Object Storage Service (OBS). Это обеспечивает производительность запросов в режиме реального времени для горячих данных, одновременно снижая долгосрочные затраты на хранение.

По сравнению с переключением между холодным/горячим хранилищем, разделение хранения и вычислений является более подходящим вариантом для сценариев, где требования к производительности поиска не являются критичными, поскольку холодные данные хранятся в OBS, что снижает затраты на хранение.

OpenSearch 1.3.6, OpenSearch 2.19.0

Управление потоком

Защищает кластеры от перегрузки с помощью политик управления потоком, таких как ограничение запросов клиентов, обратное давление индексации шарда и анализ шаблонов трафика, обеспечивая правильное распределение ресурсов и предотвращение рисков.

OpenSearch 2.19.0

Изоляция крупных запросов

Помогает эффективно управлять запросами, требующими большого объёма памяти и длительного времени выполнения, обеспечивая стабильность кластера.

OpenSearch 2.19.0

Улучшенная агрегация

Кластеры OpenSearch CSS повышают производительность агрегации при больших объёмах данных, используя векторизацию и оптимизированную кластеризацию, обеспечивая более быструю аналитику и принятие решений в сложных ситуациях.

OpenSearch 2.19.0

Разделение чтения/записи

Перенаправляет записи в лидер‑кластер и запросы в кластер‑последователь. Это разделение нагрузок повышает стабильность, масштабируемость и возможности обработки высоких уровней параллелизма кластеров.

OpenSearch 2.19.0

Переключение между горячим и холодным хранилищем

Переключение между горячим и холодным хранилищем означает распределение данных по узлам с различными характеристиками производительности в зависимости от температуры данных (то есть того, как часто к ним обращаются). Обычно для хранения горячих данных (данных в реальном времени), к которым часто обращаются, используется высокопроизводительное оборудование (например, SSDs), тогда как для хранения холодных данных (исторических данных), к которым обращаются реже, применяется недорогое оборудование (например, HDDs). Цель — достичь оптимальных затрат на хранение и производительность запросов.

По сравнению с разгрузкой хранения и вычислений, переключение между холодным/горячим хранилищем является более подходящим вариантом для сценариев, требующих высокой производительности поиска. Холодные данные хранятся на локальных узлах холодных данных в кластере. Доступный объём хранения зависит от количества узлов холодных данных и их ёмкости дисков. Стоимость хранения выше, чем у OBS.

Эта функция поддерживается, пока в кластере есть узлы холодных данных.

Корзина восстановления индексов

Чтобы предотвратить потерю данных из‑за случайного удаления, CSS предоставляет корзину восстановления индексов. При включении удалённые индексы временно сохраняются в корзине, что позволяет восстановить их до окончательного удаления. Эта функция повышает надёжность данных и операционную безопасность.

OpenSearch 2.19.0