В этом разделе описывается, как проверять метрики кластера в Cloud Eye. Путём мониторинга рабочих метрик кластера вы можете определить момент, когда кластер базы данных аномален, и проанализировать потенциальные проблемы активности на основе журналов базы данных, улучшая производительность базы данных. В этом разделе описываются метрики, которые могут мониториться Cloud Eye, а также их пространства имён и измерения. Вы можете использовать консоль управления или API, предоставляемые Cloud Eye, для запроса метрик мониторинга и тревог, генерируемых GaussDB(DWS). Для получения подробной информации см. Руководство пользователя и Справочник API Cloud Eye.
SYS.DWS
С помощью метрик мониторинга GaussDB(DWS), предоставляемых Cloud Eye, вы можете получить информацию о состоянии работы кластера и его производительности. Эта информация позволит лучше понять данные на уровне узла.
Таблица 1 описывает метрики мониторинга GaussDB(DWS).
ID метрики | Имя | Описание | Диапазон значений | Единица | Правило преобразования | Объект мониторинга & измерение | Период мониторинга (сырые данные) |
|---|---|---|---|---|---|---|---|
dws001_shared_buffer_hit_ratio | Коэффициент попадания в кэш | Отношение запрошенных данных, которые уже находятся в кэше. Это отношение объёма данных, уже находящихся в кэше, к общему объёму запрошенных данных. Более высокий коэффициент попадания в кэш означает более интенсивное использование кэша системой, реже необходимость чтения данных с диска или сети и более быструю реакцию системы. | 0% до 100% | % | N/A | Кластер хранилища данных | 4 минуты |
dws002_in_memory_sort_ratio | Коэффициент сортировки в памяти | Отношение дополнительного объёма памяти, используемого алгоритмом сортировки, к объёму памяти, занимаемому отсортированными данными. В сортировке слиянием, например, размер буфера слияния часто пропорционален размеру отсортированных данных, поэтому коэффициент в памяти обычно находится в диапазоне от 10% до 50%. | 0% до 100% | % | N/A | Кластер хранилища данных | 4 минуты |
dws003_physical_reads | Чтения файлов | Общее количество чтений файлов базы данных | > 0 | count | N/A | Кластер хранилища данных | 4 минуты |
dws004_physical_writes | Запись файлов | Общее количество записей файлов базы данных | > 0 | количество | N/A | Кластер хранилища данных | 4 минуты |
dws005_physical_reads_per_second | Чтение файлов в секунду | Количество чтений файлов базы данных в секунду | ≥ 0 | count/s | N/A | Кластер хранилища данных | 4 минуты |
dws006_physical_writes_per_second | Запись файлов в секунду | Количество записей файлов базы данных в секунду | ≥ 0 | count/s | N/A | Кластер хранилища данных | 4 минуты |
dws007_db_size | Объём данных | Общий объём данных базы данных | ≥ 0 MB | MB | 1024(IEC) | Кластер хранилища данных | 4 минуты |
dws008_active_sql_count | Количество активных SQL | Количество активных SQL в базе данных | ≥ 0 | количество | N/A | Кластер хранилища данных | 4 минуты |
dws009_session_count | Количество сессий | Количество сессий, получающих доступ к базе данных | ≥ 0 | количество | N/A | Кластер хранилища данных | 4 минуты |
dws010_cpu_usage | Использование CPU | Использование CPU каждого узла в кластере | 0% to 100% | % | N/A | Узел хранилища данных | 1 минута |
dws011_mem_usage | Использование памяти | Использование памяти каждого узла в кластере, в процентах ПРИМЕЧАНИЕ: После обновления консоли до версии 8.3.0.202 использование памяти включает память, занятую кешем. Поэтому значение этой метрики увеличивается по сравнению с тем, что было до обновления. | 0% to 100% | % | N/A | Узел хранилища данных | 1 минута |
dws012_iops | IOPS | Количество запросов I/O, обрабатываемых каждым узлом в кластере в секунду | ≥ 0 | count/s | N/A | Узел хранилища данных | 1 минута |
dws013_bytes_in | Пропускная способность входящего трафика | Ввод данных в каждый узел кластера в секунду по сети | ≥ 0 bytes/s | byte/s | 1024(IEC) | Узел хранилища данных | 1 минута |
dws014_bytes_out | Пропускная способность исходящего трафика | Данные, отправляемые в сеть в секунду с каждого узла кластера | ≥ 0 байт/с | байт/с | 1024(IEC) | Узел хранилища данных | 1 минута |
dws015_disk_usage | Использование диска | Использование диска каждого узла в кластере | 0% до 100% | % | N/A | Узел хранилища данных | 1 минута |
dws016_disk_total_size | Общий размер диска | Общий объём диска каждого узла в кластере | 100 до 2,000 ГБ | ГБ | 1024(IEC) | Узел хранилища данных | 1 минута |
dws017_disk_used_size | Используемое дисковое пространство | Используемый дисковый объём каждого узла в кластере | 0 до 3,600 ГБ | ГБ | 1024(IEC) | Узел хранилища данных | 1 минута |
dws018_disk_read_throughput | Пропускная способность чтения диска | Объём данных, читаемый с каждого диска в кластере в секунду | ≥ 0 байт/с | байт/с | 1024(IEC) | Узел хранилища данных | 1 минута |
dws019_disk_write_throughput | Пропускная способность записи диска | Объём данных, записываемый на каждый диск в кластере в секунду | ≥ 0 байт/с | байт/с | 1024(IEC) | Узел хранилища данных | 1 минута |
dws020_avg_disk_sec_per_read | Среднее время чтения диска | Среднее время, используемое каждый раз, когда диск читает данные | > 0 с | Секунда | N/A | Узел хранилища данных | 1 минута |
dws021_avg_disk_sec_per_write | Среднее время записи диска | Среднее время, используемое каждый раз, когда данные записываются на диск | > 0 с | Секунда | N/A | Узел хранилища данных | 1 минута |
dws022_avg_disk_queue_length | Средняя длина очереди диска | Средняя длина очереди ввода‑вывода диска | ≥ 0 | количество | N/A | Узел хранилища данных | 1 минута |
dws_024_dn_diskio_util | Использование ввода‑вывода DN | Среднее использование ввода‑вывода дисков DN в кластере | 0% до 100% | % | N/A | Инстанс хранилища данных | 1 минута |
Ключ | Значение |
|---|---|
datastore_id | ID кластера хранилища данных |
dws_instance_id | Идентификатор узла хранилища данных |
Дополнительно вы можете указать конкретную метрику мониторинга и диапазон времени для просмотра кривой производительности.
Позиции клавиш функций в Операция столбец динамический. Чтобы гарантировать, что всегда отображаются две клавиши функций перед Больше, любые клавиши функций, которые обычно отображаются только при наведении курсора Больше будут перемещены в позицию непосредственно перед Больше. Это корректировка происходит, если существуют функции, чьи клавиши должны быть размещены перед Больше но они не поддерживаются для текущего сайта.
Например, выберите Линейная диаграмма и Один вид для нескольких метрик для сравнения использования CPU трех узлов GaussDB(DWS). В следующей таблице описаны параметры.

Параметр | Пример значения |
|---|---|
Тип ресурса | GaussDB(DWS) |
Измерение | Data Warehouse Node |
Monitored Object | dws-demo-dws-cn-cn-2-1 dws-demo-dws-cn-cn-1-1 dws-demo-dws-dn-1-1 |
Metric | CPU Usage |
Для выбранного My Dashboards страница, вы можете просматривать тенденцию метрик на недавно добавленном графике мониторинга. Вы можете нажать кнопку увеличения, чтобы увеличить изображение и просмотреть подробные данные сравнения метрик.
GaussDB(DWS) позволяет вам настраивать правила сигнализации для мониторинга конкретных объектов и политик уведомления, обеспечивая своевременное информирование о статусе его работы.
Правило тревоги GaussDB(DWS) включает имя правила тревоги, мониторируемый объект, метрику, пороговое значение, интервал мониторинга и параметр отправки уведомления. В данном разделе описывается, как настроить правила тревоги GaussDB(DWS).
Состояние целевого кластера должно быть Доступен. В противном случае вы не сможете создать правила тревоги.
Параметр | Описание | Пример значения |
|---|---|---|
Тип ресурса | Имя ресурса облачной службы, для которого настроено правило тревоги. | Data Warehouse Service |
Измерение | Измерение метрики правила тревоги. Вы можете выбрать Узлы хранилища данных или Хранилища данных. | Узел хранилища данных |
Область мониторинга | Область ресурсов, к которой применяется правило тревоги. Выберите Конкретные ресурсы и выберите один или несколько объектов мониторинга. Для GaussDB(DWS) выберите идентификатор кластера или идентификатор узла в отображаемом диалоговом окне. | Конкретные ресурсы |
Триггерное правило | Вы можете выбрать связанный шаблон, использовать существующий шаблон или при необходимости создать пользовательский шаблон. | Создать вручную |
Шаблон | Этот параметр действителен только когда Использовать шаблон выбран. Выберите шаблон для импорта. Если шаблон тревоги недоступен, нажмите Create Custom Template чтобы создать тот, который соответствует вашим требованиям. | - |
Alarm Policy | Этот параметр действителен только когда Create manually выбран. Установите политику, вызывающую тревогу. Например, вызвать тревогу, если использование CPU равно или превышает 80% в течение 3 последовательных периодов. Table 1 перечисляет метрики мониторинга GaussDB(DWS). | - |
Alarm Severity | Severity of an alarm. Valid values are Critical, Major, Низкий, и Информационный. | Критический |
Параметр | Описание | Пример значения |
|---|---|---|
Уведомление о тревоге | Определяет, уведомлять ли пользователей при срабатывании тревог. Уведомления могут отправляться по электронной почте или в виде текстовых сообщений, либо в виде запросов HTTP/HTTPS, отправляемых на серверы. Вы можете включить (рекомендуется) или отключить Уведомление о тревоге. | Включить |
Период действия | Cloud Eye отправляет уведомления только в течение периода действия, указанного в правиле тревоги. Например, если Период действия установлен на 00:00-8:00, Cloud Eye отправляет уведомления только в период 00:00-8:00. | - |
Объект уведомления | Имя темы, в которую отправляется уведомление о тревоге. Если вы включите Alarm Notification, вам необходимо выбрать тему. Если нужные темы недоступны, сначала создайте её, после чего будет вызван сервис SMN. Для получения подробной информации о том, как создать тему, см. Simple Message Notification User Guide. Для получения подробной информации о том, как создать тему, см. Simple Message Notification User Guide. | - |
Trigger Condition | Условие для срабатывания тревоги. Вы можете выбрать Generated alarm, Cleared alarm, или оба. | - |
После создания правила тревоги, если данные метрики достигают заданного порога, Cloud Eye немедленно оповестит вас о возникновении исключения.