Функция
В этом разделе описывается, как проверять метрики кластера в Cloud Eye. Путём мониторинга рабочих метрик кластера вы можете определить момент, когда кластер базы данных аномален, и проанализировать потенциальные проблемы активности на основе журналов базы данных, улучшая производительность базы данных. В этом разделе описываются метрики, которые могут мониториться Cloud Eye, а также их пространства имён и измерения. Вы можете использовать консоль управления или API, предоставляемые Cloud Eye, для запроса метрик мониторинга и тревог, генерируемых GaussDB(DWS). Для получения подробной информации см. Руководство пользователя и Справочник API Cloud Eye.
Пространство имён
SYS.DWS
Метрики мониторинга кластера
С помощью метрик мониторинга GaussDB(DWS), предоставляемых Cloud Eye, вы можете получить информацию о состоянии работы кластера и его производительности. Эта информация позволит лучше понять данные на уровне узла.
Таблица 1 описывает метрики мониторинга GaussDB(DWS).
ID метрики | Имя | Описание | Диапазон значений | Единица | Правило преобразования | Объект мониторинга & измерение | Период мониторинга (сырые данные) |
---|---|---|---|---|---|---|---|
dws001_shared_buffer_hit_ratio | Коэффициент попадания в кэш | Отношение запрошенных данных, которые уже находятся в кэше. Это отношение объёма данных, уже находящихся в кэше, к общему объёму запрошенных данных. Более высокий коэффициент попадания в кэш означает более интенсивное использование кэша системой, реже необходимость чтения данных с диска или сети и более быструю реакцию системы. | 0% до 100% | % | N/A | Кластер хранилища данных | 4 минуты |
dws002_in_memory_sort_ratio | Коэффициент сортировки в памяти | Отношение дополнительного объёма памяти, используемого алгоритмом сортировки, к объёму памяти, занимаемому отсортированными данными. В сортировке слиянием, например, размер буфера слияния часто пропорционален размеру отсортированных данных, поэтому коэффициент в памяти обычно находится в диапазоне от 10% до 50%. | 0% до 100% | % | N/A | Кластер хранилища данных | 4 минуты |
dws003_physical_reads | Чтения файлов | Общее количество чтений файлов базы данных | > 0 | count | N/A | Кластер хранилища данных | 4 минуты |
dws004_physical_writes | Запись файлов | Общее количество записей файлов базы данных | > 0 | количество | N/A | Кластер хранилища данных | 4 минуты |
dws005_physical_reads_per_second | Чтение файлов в секунду | Количество чтений файлов базы данных в секунду | ≥ 0 | count/s | N/A | Кластер хранилища данных | 4 минуты |
dws006_physical_writes_per_second | Запись файлов в секунду | Количество записей файлов базы данных в секунду | ≥ 0 | count/s | N/A | Кластер хранилища данных | 4 минуты |
dws007_db_size | Объём данных | Общий объём данных базы данных | ≥ 0 MB | MB | 1024(IEC) | Кластер хранилища данных | 4 минуты |
dws008_active_sql_count | Количество активных SQL | Количество активных SQL в базе данных | ≥ 0 | количество | N/A | Кластер хранилища данных | 4 минуты |
dws009_session_count | Количество сессий | Количество сессий, получающих доступ к базе данных | ≥ 0 | количество | N/A | Кластер хранилища данных | 4 минуты |
dws010_cpu_usage | Использование CPU | Использование CPU каждого узла в кластере | 0% to 100% | % | N/A | Узел хранилища данных | 1 минута |
dws011_mem_usage | Использование памяти | Использование памяти каждого узла в кластере, в процентах ПРИМЕЧАНИЕ: После обновления консоли до версии 8.3.0.202 использование памяти включает память, занятую кешем. Поэтому значение этой метрики увеличивается по сравнению с тем, что было до обновления. | 0% to 100% | % | N/A | Узел хранилища данных | 1 минута |
dws012_iops | IOPS | Количество запросов I/O, обрабатываемых каждым узлом в кластере в секунду | ≥ 0 | count/s | N/A | Узел хранилища данных | 1 минута |
dws013_bytes_in | Пропускная способность входящего трафика | Ввод данных в каждый узел кластера в секунду по сети | ≥ 0 bytes/s | byte/s | 1024(IEC) | Узел хранилища данных | 1 минута |
dws014_bytes_out | Пропускная способность исходящего трафика | Данные, отправляемые в сеть в секунду с каждого узла кластера | ≥ 0 байт/с | байт/с | 1024(IEC) | Узел хранилища данных | 1 минута |
dws015_disk_usage | Использование диска | Использование диска каждого узла в кластере | 0% до 100% | % | N/A | Узел хранилища данных | 1 минута |
dws016_disk_total_size | Общий размер диска | Общий объём диска каждого узла в кластере | 100 до 2,000 ГБ | ГБ | 1024(IEC) | Узел хранилища данных | 1 минута |
dws017_disk_used_size | Используемое дисковое пространство | Используемый дисковый объём каждого узла в кластере | 0 до 3,600 ГБ | ГБ | 1024(IEC) | Узел хранилища данных | 1 минута |
dws018_disk_read_throughput | Пропускная способность чтения диска | Объём данных, читаемый с каждого диска в кластере в секунду | ≥ 0 байт/с | байт/с | 1024(IEC) | Узел хранилища данных | 1 минута |
dws019_disk_write_throughput | Пропускная способность записи диска | Объём данных, записываемый на каждый диск в кластере в секунду | ≥ 0 байт/с | байт/с | 1024(IEC) | Узел хранилища данных | 1 минута |
dws020_avg_disk_sec_per_read | Среднее время чтения диска | Среднее время, используемое каждый раз, когда диск читает данные | > 0 с | Секунда | N/A | Узел хранилища данных | 1 минута |
dws021_avg_disk_sec_per_write | Среднее время записи диска | Среднее время, используемое каждый раз, когда данные записываются на диск | > 0 с | Секунда | N/A | Узел хранилища данных | 1 минута |
dws022_avg_disk_queue_length | Средняя длина очереди диска | Средняя длина очереди ввода‑вывода диска | ≥ 0 | количество | N/A | Узел хранилища данных | 1 минута |
dws_024_dn_diskio_util | Использование ввода‑вывода DN | Среднее использование ввода‑вывода дисков DN в кластере | 0% до 100% | % | N/A | Инстанс хранилища данных | 1 минута |
Размерности
Ключ | Значение |
---|---|
datastore_id | ID кластера хранилища данных |
dws_instance_id | Идентификатор узла хранилища данных |
Информация мониторинга кластера и узла
- Войдите в консоль GaussDB(DWS) и выберите Выделенные кластеры > Кластеры.
- Просмотреть информацию о кластере. В списке кластеров нажмите Просмотреть метрику в Операция столбец, где находится конкретный кластер. Отображается консоль управления Cloud Eye. По умолчанию отображается информация мониторинга кластера в консоли управления Cloud Eye.
Дополнительно вы можете указать конкретную метрику мониторинга и диапазон времени для просмотра кривой производительности.
NoteПозиции клавиш функций в Операция столбец динамический. Чтобы гарантировать, что всегда отображаются две клавиши функций перед Больше, любые клавиши функций, которые обычно отображаются только при наведении курсора Больше будут перемещены в позицию непосредственно перед Больше. Это корректировка происходит, если существуют функции, чьи клавиши должны быть размещены перед Больше но они не поддерживаются для текущего сайта.
Сравнение метрик мониторинга нескольких узлов
- В навигационной панели консоли управления Cloud Eye выберите Дашборды > Мои дашборды. Щелкните имя дашборда, для которого вы хотите добавить график. На Мои дашборды странице, которая отображается, щелкните Добавить график.
- На Добавить граф странице, вы можете выбрать Линейная диаграмма или Столбчатая диаграмма для отображения графика. После подтверждения правильности информации нажмите OK.
Например, выберите Линейная диаграмма и Один вид для нескольких метрик для сравнения использования CPU трех узлов GaussDB(DWS). В следующей таблице описаны параметры.
Таблица 2 Пример конфигурации Параметр
Пример значения
Тип ресурса
GaussDB(DWS)
Измерение
Data Warehouse Node
Monitored Object
dws-demo-dws-cn-cn-2-1
dws-demo-dws-cn-cn-1-1
dws-demo-dws-dn-1-1
Metric
CPU Usage
- Click OK.
Для выбранного My Dashboards страница, вы можете просматривать тенденцию метрик на недавно добавленном графике мониторинга. Вы можете нажать кнопку увеличения, чтобы увеличить изображение и просмотреть подробные данные сравнения метрик.
Creating Alarm Rules
GaussDB(DWS) позволяет вам настраивать правила сигнализации для мониторинга конкретных объектов и политик уведомления, обеспечивая своевременное информирование о статусе его работы.
Правило тревоги GaussDB(DWS) включает имя правила тревоги, мониторируемый объект, метрику, пороговое значение, интервал мониторинга и параметр отправки уведомления. В данном разделе описывается, как настроить правила тревоги GaussDB(DWS).
- Войдите в консоль GaussDB(DWS).
- Выберите Выделенные кластеры > Кластеры в навигационной области.
- Найдите строку, содержащую целевой кластер, нажмите Просмотр метрики в Операция столбце, чтобы открыть консоль управления Cloud Eye и просмотреть информацию мониторинга GaussDB(DWS).
Состояние целевого кластера должно быть Доступен. В противном случае вы не сможете создать правила тревоги.
- В левой навигационной панели консоли управления Cloud Eye выберите Управление тревогами > Правила тревог.
- На Правила тревог странице, нажмите Создать правило тревоги в верхнем правом углу.
- На Создать правило тревоги странице, задайте параметры согласно подсказкам.
- Установите имя правила и описание.
- Настройте параметры тревоги согласно подсказкам.
Таблица 3 Настройка параметров тревоги Параметр
Описание
Пример значения
Тип ресурса
Имя ресурса облачной службы, для которого настроено правило тревоги.
Data Warehouse Service
Измерение
Измерение метрики правила тревоги. Вы можете выбрать Узлы хранилища данных или Хранилища данных.
Узел хранилища данных
Область мониторинга
Область ресурсов, к которой применяется правило тревоги. Выберите Конкретные ресурсы и выберите один или несколько объектов мониторинга. Для GaussDB(DWS) выберите идентификатор кластера или идентификатор узла в отображаемом диалоговом окне.
Конкретные ресурсы
Триггерное правило
Вы можете выбрать связанный шаблон, использовать существующий шаблон или при необходимости создать пользовательский шаблон.
Создать вручную
Шаблон
Этот параметр действителен только когда Использовать шаблон выбран.
Выберите шаблон для импорта. Если шаблон тревоги недоступен, нажмите Create Custom Template чтобы создать тот, который соответствует вашим требованиям.
-
Alarm Policy
Этот параметр действителен только когда Create manually выбран.
Установите политику, вызывающую тревогу. Например, вызвать тревогу, если использование CPU равно или превышает 80% в течение 3 последовательных периодов.
Table 1 перечисляет метрики мониторинга GaussDB(DWS).
-
Alarm Severity
Severity of an alarm. Valid values are Critical, Major, Низкий, и Информационный.
Критический
- Настройте параметры уведомления о тревоге согласно подсказкам.
Таблица 4 Настройка уведомлений о тревогах Параметр
Описание
Пример значения
Уведомление о тревоге
Определяет, уведомлять ли пользователей при срабатывании тревог. Уведомления могут отправляться по электронной почте или в виде текстовых сообщений, либо в виде запросов HTTP/HTTPS, отправляемых на серверы.
Вы можете включить (рекомендуется) или отключить Уведомление о тревоге.
Включить
Период действия
Cloud Eye отправляет уведомления только в течение периода действия, указанного в правиле тревоги.
Например, если Период действия установлен на 00:00-8:00, Cloud Eye отправляет уведомления только в период 00:00-8:00.
-
Объект уведомления
Имя темы, в которую отправляется уведомление о тревоге.
Если вы включите Alarm Notification, вам необходимо выбрать тему. Если нужные темы недоступны, сначала создайте её, после чего будет вызван сервис SMN. Для получения подробной информации о том, как создать тему, см. Simple Message Notification User Guide.
Для получения подробной информации о том, как создать тему, см. Simple Message Notification User Guide.
-
Trigger Condition
Условие для срабатывания тревоги. Вы можете выбрать Generated alarm, Cleared alarm, или оба.
-
- После завершения настройки нажмите Next.
После создания правила тревоги, если данные метрики достигают заданного порога, Cloud Eye немедленно оповестит вас о возникновении исключения.
- Функция
- Пространство имён
- Метрики мониторинга кластера
- Измерения
- Информация мониторинга кластера и узла
- Сравнение метрик мониторинга нескольких узлов
- Создание правил тревоги