По сравнению с открытым OpenSearch, кластеры OpenSearch в CSS имеют множество улучшенных функций. Таблица 1 Перечисляет эти улучшенные функции и соответствующие версии кластеров.
Улучшенная функция | Описание | Версия кластера | Подробности |
|---|---|---|---|
Векторный поиск | Неcтруктурированные данные, такие как изображения, видео и языковые корпусы, преобразуются в векторы, которые ищутся по сходству с использованием точного или приближённого алгоритма ближайших соседей. | OpenSearch 1.3.6, OpenSearch 2.19.0 | |
Разделение хранилища и вычислений | Горячие данные, которые часто запрашиваются, хранятся в высокопроизводительных носителях, в то время как холодные данные, которые запрашиваются редко, переносятся в недорогие носители — Object Storage Service (OBS). Это обеспечивает производительность запросов в режиме реального времени для горячих данных, одновременно снижая долгосрочные затраты на хранение. По сравнению с переключением между холодным/горячим хранилищем, разделение хранения и вычислений является более подходящим вариантом для сценариев, где требования к производительности поиска не являются критичными, поскольку холодные данные хранятся в OBS, что снижает затраты на хранение. | OpenSearch 1.3.6, OpenSearch 2.19.0 | |
Управление потоком | Защищает кластеры от перегрузки с помощью политик управления потоком, таких как ограничение запросов клиентов, обратное давление индексации шарда и анализ шаблонов трафика, обеспечивая правильное распределение ресурсов и предотвращение рисков. | OpenSearch 2.19.0 | |
Изоляция крупных запросов | Помогает эффективно управлять запросами, требующими большого объёма памяти и длительного времени выполнения, обеспечивая стабильность кластера. | OpenSearch 2.19.0 | |
Улучшенная агрегация | Кластеры OpenSearch CSS повышают производительность агрегации при больших объёмах данных, используя векторизацию и оптимизированную кластеризацию, обеспечивая более быструю аналитику и принятие решений в сложных ситуациях. | OpenSearch 2.19.0 | |
Разделение чтения/записи | Перенаправляет записи в лидер‑кластер и запросы в кластер‑последователь. Это разделение нагрузок повышает стабильность, масштабируемость и возможности обработки высоких уровней параллелизма кластеров. | OpenSearch 2.19.0 | |
Переключение между горячим и холодным хранилищем | Переключение между горячим и холодным хранилищем означает распределение данных по узлам с различными характеристиками производительности в зависимости от температуры данных (то есть того, как часто к ним обращаются). Обычно для хранения горячих данных (данных в реальном времени), к которым часто обращаются, используется высокопроизводительное оборудование (например, SSDs), тогда как для хранения холодных данных (исторических данных), к которым обращаются реже, применяется недорогое оборудование (например, HDDs). Цель — достичь оптимальных затрат на хранение и производительность запросов. По сравнению с разгрузкой хранения и вычислений, переключение между холодным/горячим хранилищем является более подходящим вариантом для сценариев, требующих высокой производительности поиска. Холодные данные хранятся на локальных узлах холодных данных в кластере. Доступный объём хранения зависит от количества узлов холодных данных и их ёмкости дисков. Стоимость хранения выше, чем у OBS. | Эта функция поддерживается, пока в кластере есть узлы холодных данных. | |
Корзина восстановления индексов | Чтобы предотвратить потерю данных из‑за случайного удаления, CSS предоставляет корзину восстановления индексов. При включении удалённые индексы временно сохраняются в корзине, что позволяет восстановить их до окончательного удаления. Эта функция повышает надёжность данных и операционную безопасность. | OpenSearch 2.19.0 |