В этом разделе описывается, как проверять метрики кластера в Cloud Eye. Путём мониторинга работающих метрик кластера вы можете определить время, когда кластер базы данных аномален, и проанализировать потенциальные проблемы активности на основе журналов базы данных, повышая производительность базы данных. В этом разделе описываются метрики, которые может мониторить Cloud Eye, а также их пространства имён и измерения. Вы можете использовать консоль управления или API, предоставляемые Cloud Eye, для запроса мониторинговых метрик и сигналов тревоги, генерируемых DWS. Для подробностей см Руководство пользователя и Справочник API для Cloud Eye.
SYS.DWS
С помощью метрик мониторинга DWS, предоставляемых Cloud Eye, вы можете получить информацию о состоянии работы кластера и его производительности. Эта информация позволит лучше понять сведения уровня узлов.
Таблица 1 описывает метрики мониторинга DWS.
ID метрики | Имя | Описание | Диапазон значений | Единица измерения | Правило преобразования | Мониторируемый объект и измерение | Период мониторинга (исходные данные) |
|---|---|---|---|---|---|---|---|
dws001_shared_buffer_hit_ratio | Коэффициент попадания в кэш | Соотношение запрошенных данных, уже находящихся в кэше. Это соотношение объёма данных, уже находящихся в кэше, к общему объёму запрошенных данных. Более высокий коэффициент попадания в кэш означает более активное использование кэша системой, реже необходимость чтения данных с диска или сети и более быструю реакцию системы. | от 0% до 100% | % | N/A | Кластер хранилища данных | 4 минуты |
dws002_in_memory_sort_ratio | Коэффициент сортировки в памяти | Соотношение дополнительного объёма памяти, используемого алгоритмом сортировки, к объёму памяти, занятой отсортированными данными. Например, при сортировке слиянием размер буфера слияния часто пропорционален размеру отсортированных данных, поэтому коэффициент сортировки в памяти обычно находится в диапазоне от 10% до 50%. | 0% до 100% | % | N/A | Кластер хранилища данных | 4 минуты |
dws003_physical_reads | Чтения файлов | Общее количество чтений файлов базы данных | > 0 | количество | N/A | Кластер хранилища данных | 4 минуты |
dws004_physical_writes | Записи файлов | Общее количество записей файлов базы данных | > 0 | количество | N/A | Кластер хранилища данных | 4 минуты |
dws005_physical_reads_per_second | Чтения файлов в секунду | Количество чтений файлов базы данных в секунду | ≥ 0 | count/s | N/A | Кластер хранилища данных | 4 минуты |
dws006_physical_writes_per_second | Записи файлов в секунду | Количество записей файлов базы данных в секунду | ≥ 0 | count/s | N/A | Кластер хранилища данных | 4 минуты |
dws007_db_size | Объём данных | Общий объём данных базы данных | ≥ 0 MB | MB | 1024(IEC) | Кластер хранилища данных | 4 минуты |
dws008_active_sql_count | Количество активных SQL | Количество активных SQL в базе данных | ≥ 0 | количество | N/A | Кластер хранилища данных | 4 минуты |
dws009_session_count | Количество сессий | Количество сессий, которые обращаются к базе данных | ≥ 0 | количество | N/A | Кластер хранилища данных | 4 минуты |
dws010_cpu_usage | Использование CPU | Использование CPU каждого узла в кластере | 0% to 100% | % | N/A | Узел хранилища данных | 1 минута |
dws011_mem_usage | Использование памяти | Использование памяти каждого узла в кластере, в процентах ПРИМЕЧАНИЕ: После обновления консоли до версии 8.3.0.202 использование памяти учитывает память, занятую кешем. Поэтому значение этой метрики увеличивается по сравнению с тем, которое было до обновления. | 0% to 100% | % | N/A | Узел хранилища данных | 1 минута |
dws012_iops | IOPS | Количество запросов I/O, обрабатываемых каждым узлом кластера в секунду | ≥ 0 | count/s | N/A | Узел хранилища данных | 1 минута |
dws013_bytes_in | Пропускная способность входящего трафика | Ввод данных в каждый узел кластера в секунду по сети | ≥ 0 байт/с | байт/с | 1024(IEC) | Узел хранилища данных | 1 минута |
dws014_bytes_out | Пропускная способность исходящего трафика | Данные, отправляемые в сеть в секунду из каждого узла кластера | ≥ 0 байт/с | байт/с | 1024(IEC) | Узел хранилища данных | 1 минута |
dws015_disk_usage | Использование диска | Использование диска каждого узла в кластере | 0% до 100% | % | N/A | Узел хранилища данных | 1 минута |
dws016_disk_total_size | Общий размер диска | Общий объём диска каждого узла в кластере | 100 до 2,000 GB | GB | 1024(IEC) | Узел хранилища данных | 1 минута |
dws017_disk_used_size | Используемое дисковое пространство | Используемое дисковое пространство каждого узла в кластере | 0 to 3,600 GB | GB | 1024(IEC) | Узел хранилища данных | 1 минута |
dws018_disk_read_throughput | Пропускная способность чтения диска | Объём данных, читаемых с каждого диска в кластере в секунду | ≥ 0 bytes/s | byte/s | 1024(IEC) | Узел хранилища данных | 1 минута |
dws019_disk_write_throughput | Пропускная способность записи диска | Объём данных, записываемых на каждый диск в кластере в секунду | ≥ 0 bytes/s | byte/s | 1024(IEC) | Узел хранилища данных | 1 минута |
dws020_avg_disk_sec_per_read | Среднее время чтения диска | Среднее время, затрачиваемое каждый раз при чтении данных диском | > 0s | Секунда | N/A | Узел хранилища данных | 1 минута |
dws021_avg_disk_sec_per_write | Среднее время записи диска | Среднее время, затрачиваемое каждый раз при записи данных на диск | > 0s | Секунда | N/A | Узел хранилища данных | 1 минута |
dws022_avg_disk_queue_length | Средняя длина очереди диска | Средняя длина очереди I/O на диске | ≥ 0 | количество | N/A | Узел хранилища данных | 1 минута |
dws_024_dn_diskio_util | Использование I/O DN | Среднее использование I/O диска DNs в кластере | 0% to 100% | % | N/A | Экземпляр хранилища данных | 1 минута |
Ключ | Значение |
|---|---|
datastore_id | ID кластера хранилища данных |
dws_instance_id | ID узла хранилища данных |
Кроме того, вы можете указать конкретную метрику мониторинга и диапазон времени для просмотра кривой производительности.
Позиции клавиш функций в Операция столбец динамичен. Чтобы гарантировать, что всегда видны две клавиши функций перед Больше, любые клавиши функций, которые обычно появляются только при наведении курсора на Больше будет перемещено в позицию непосредственно перед Больше. Это исправление происходит, если существуют функции, ключи которых должны быть размещены перед Больше но не поддерживаются для текущего сайта.
Например, выберите Линейный график и Один вид для нескольких метрик для сравнения использования CPU тремя узлами DWS. В следующей таблице описаны параметры.

Параметр | Пример значения |
|---|---|
Тип ресурса | DWS |
Измерение | Узел хранилища данных |
Мониторируемый объект | dws-demo-dws-cn-cn-2-1 dws-demo-dws-cn-cn-1-1 dws-demo-dws-dn-1-1 |
Метрика | Использование CPU |
На выбранном Мои Дашборды странице, вы можете просматривать тенденцию метрик на недавно добавленном графике мониторинга. Вы можете нажать кнопку увеличения, чтобы увеличить масштаб и просмотреть детальные данные сравнения метрик.
Настройка правил тревоги DWS позволяет вам настраивать контролируемые объекты и политики уведомлений, а также определять статус работы вашего DWS в любой момент.
Правила тревоги DWS включают имя правила тревоги, инстанс, метрику, порог, интервал мониторинга и параметр отправки уведомления. Этот раздел описывает, как настроить правила тревоги DWS.
Статус целевого кластера должен быть Доступно. В противном случае вы не сможете создать правила оповещения.
Параметр | Описание | Example Value |
|---|---|---|
Resource Type | Имя ресурса облачной службы, для которого настроено правило сигнала тревоги. | Data Warehouse Service |
Измерение | Измерение метрики правила сигнала тревоги. Вы можете выбрать Data Warehouse Nodes или Data Warehouses. | Data Warehouse Node |
Monitoring Scope | Область ресурсов, к которой применяется правило тревоги. Выберите Specific resources и выберите один или несколько объектов мониторинга. Для DWS, выберите идентификатор кластера или идентификатор узла в отображаемом диалоговом окне. | Specific resources |
Trigger Rule | Вы можете выбрать связанный шаблон, использовать существующий шаблон или создать пользовательский шаблон по мере необходимости. | Create manually |
Template | Этот параметр действителен только когда Использовать шаблон выбрано. Выберите шаблон для импорта. Если шаблон тревоги недоступен, нажмите Create Custom Template чтобы создать один, соответствующий вашим требованиям. | - |
Политика тревоги | Этот параметр действителен только когда Создать вручную выбран. Установите политику, вызывающую тревогу. Например, вызовите тревогу, если использование CPU равно или превышает 80% в течение 3 подряд идущих периодов. Таблица 1 перечисляет метрики мониторинга DWS. | - |
Серьезность тревоги | Серьезность тревоги. Допустимые значения Критическая, Важная, Незначительная, и Информационная. | Важная |
Параметр | Описание | Пример значения |
|---|---|---|
Alarm Notification | Указывает, следует ли уведомлять пользователей при срабатывании тревог. Уведомления могут отправляться по электронной почте или в виде текстовых сообщений, либо в виде HTTP/HTTPS‑запросов, отправляемых на серверы. Вы можете включить (рекомендовано) или отключить Alarm Notification. | Включить |
Validity Period | Cloud Eye отправляет уведомления только в течение периода действия, указанного в правиле тревоги. Например, если Validity Period установлен на 00:00-8:00, Cloud Eye отправляет уведомления только в течение 00:00-8:00. | - |
Объект уведомления | Имя темы, на которую отправляется уведомление о тревоге. Если вы включите Уведомление о тревоге, вам необходимо выбрать тему. Если нужных тем нет, сначала создайте одну, после чего будет вызван сервис SMN. Подробнее о том, как создать тему, смотрите Simple Message Notification User Guide. Подробности о том, как создать тему, смотрите Simple Message Notification User Guide. | - |
Условие срабатывания | Условие срабатывания тревоги. Вы можете выбрать Сгенерированная тревога, Снятая тревога, или обе. | - |
После создания правила тревоги, если данные метрики достигают указанного порога, Cloud Eye немедленно информирует вас о возникновении исключения.