Advanced
Тема интерфейса

Просмотр информации мониторинга кластера GaussDB(DWS) в Cloud Eye

Язык статьи: Русский
Показать оригинал
Страница переведена автоматически и может содержать неточности. Рекомендуем сверяться с английской версией.

Функция

В этом разделе описывается, как проверять метрики кластера в Cloud Eye. Путём мониторинга рабочих метрик кластера вы можете определить момент, когда кластер базы данных аномален, и проанализировать потенциальные проблемы активности на основе журналов базы данных, улучшая производительность базы данных. В этом разделе описываются метрики, которые могут мониториться Cloud Eye, а также их пространства имён и измерения. Вы можете использовать консоль управления или API, предоставляемые Cloud Eye, для запроса метрик мониторинга и тревог, генерируемых GaussDB(DWS). Для получения подробной информации см. Руководство пользователя и Справочник API Cloud Eye.

Пространство имён

SYS.DWS

Метрики мониторинга кластера

С помощью метрик мониторинга GaussDB(DWS), предоставляемых Cloud Eye, вы можете получить информацию о состоянии работы кластера и его производительности. Эта информация позволит лучше понять данные на уровне узла.

Таблица 1 описывает метрики мониторинга GaussDB(DWS).

Таблица 1 Метрики мониторинга GaussDB(DWS)

ID метрики

Имя

Описание

Диапазон значений

Единица

Правило преобразования

Объект мониторинга & измерение

Период мониторинга (сырые данные)

dws001_shared_buffer_hit_ratio

Коэффициент попадания в кэш

Отношение запрошенных данных, которые уже находятся в кэше. Это отношение объёма данных, уже находящихся в кэше, к общему объёму запрошенных данных. Более высокий коэффициент попадания в кэш означает более интенсивное использование кэша системой, реже необходимость чтения данных с диска или сети и более быструю реакцию системы.

0% до 100%

%

N/A

Кластер хранилища данных

4 минуты

dws002_in_memory_sort_ratio

Коэффициент сортировки в памяти

Отношение дополнительного объёма памяти, используемого алгоритмом сортировки, к объёму памяти, занимаемому отсортированными данными. В сортировке слиянием, например, размер буфера слияния часто пропорционален размеру отсортированных данных, поэтому коэффициент в памяти обычно находится в диапазоне от 10% до 50%.

0% до 100%

%

N/A

Кластер хранилища данных

4 минуты

dws003_physical_reads

Чтения файлов

Общее количество чтений файлов базы данных

> 0

count

N/A

Кластер хранилища данных

4 минуты

dws004_physical_writes

Запись файлов

Общее количество записей файлов базы данных

> 0

количество

N/A

Кластер хранилища данных

4 минуты

dws005_physical_reads_per_second

Чтение файлов в секунду

Количество чтений файлов базы данных в секунду

≥ 0

count/s

N/A

Кластер хранилища данных

4 минуты

dws006_physical_writes_per_second

Запись файлов в секунду

Количество записей файлов базы данных в секунду

≥ 0

count/s

N/A

Кластер хранилища данных

4 минуты

dws007_db_size

Объём данных

Общий объём данных базы данных

≥ 0 MB

MB

1024(IEC)

Кластер хранилища данных

4 минуты

dws008_active_sql_count

Количество активных SQL

Количество активных SQL в базе данных

≥ 0

количество

N/A

Кластер хранилища данных

4 минуты

dws009_session_count

Количество сессий

Количество сессий, получающих доступ к базе данных

≥ 0

количество

N/A

Кластер хранилища данных

4 минуты

dws010_cpu_usage

Использование CPU

Использование CPU каждого узла в кластере

0% to 100%

%

N/A

Узел хранилища данных

1 минута

dws011_mem_usage

Использование памяти

Использование памяти каждого узла в кластере, в процентах

ПРИМЕЧАНИЕ:

После обновления консоли до версии 8.3.0.202 использование памяти включает память, занятую кешем. Поэтому значение этой метрики увеличивается по сравнению с тем, что было до обновления.

0% to 100%

%

N/A

Узел хранилища данных

1 минута

dws012_iops

IOPS

Количество запросов I/O, обрабатываемых каждым узлом в кластере в секунду

≥ 0

count/s

N/A

Узел хранилища данных

1 минута

dws013_bytes_in

Пропускная способность входящего трафика

Ввод данных в каждый узел кластера в секунду по сети

≥ 0 bytes/s

byte/s

1024(IEC)

Узел хранилища данных

1 минута

dws014_bytes_out

Пропускная способность исходящего трафика

Данные, отправляемые в сеть в секунду с каждого узла кластера

≥ 0 байт/с

байт/с

1024(IEC)

Узел хранилища данных

1 минута

dws015_disk_usage

Использование диска

Использование диска каждого узла в кластере

0% до 100%

%

N/A

Узел хранилища данных

1 минута

dws016_disk_total_size

Общий размер диска

Общий объём диска каждого узла в кластере

100 до 2,000 ГБ

ГБ

1024(IEC)

Узел хранилища данных

1 минута

dws017_disk_used_size

Используемое дисковое пространство

Используемый дисковый объём каждого узла в кластере

0 до 3,600 ГБ

ГБ

1024(IEC)

Узел хранилища данных

1 минута

dws018_disk_read_throughput

Пропускная способность чтения диска

Объём данных, читаемый с каждого диска в кластере в секунду

≥ 0 байт/с

байт/с

1024(IEC)

Узел хранилища данных

1 минута

dws019_disk_write_throughput

Пропускная способность записи диска

Объём данных, записываемый на каждый диск в кластере в секунду

≥ 0 байт/с

байт/с

1024(IEC)

Узел хранилища данных

1 минута

dws020_avg_disk_sec_per_read

Среднее время чтения диска

Среднее время, используемое каждый раз, когда диск читает данные

> 0 с

Секунда

N/A

Узел хранилища данных

1 минута

dws021_avg_disk_sec_per_write

Среднее время записи диска

Среднее время, используемое каждый раз, когда данные записываются на диск

> 0 с

Секунда

N/A

Узел хранилища данных

1 минута

dws022_avg_disk_queue_length

Средняя длина очереди диска

Средняя длина очереди ввода‑вывода диска

≥ 0

количество

N/A

Узел хранилища данных

1 минута

dws_024_dn_diskio_util

Использование ввода‑вывода DN

Среднее использование ввода‑вывода дисков DN в кластере

0% до 100%

%

N/A

Инстанс хранилища данных

1 минута

Размерности

Ключ

Значение

datastore_id

ID кластера хранилища данных

dws_instance_id

Идентификатор узла хранилища данных

Информация мониторинга кластера и узла

  1. Войдите в консоль GaussDB(DWS) и выберите Выделенные кластеры > Кластеры.
  2. Просмотреть информацию о кластере. В списке кластеров нажмите Просмотреть метрику в Операция столбец, где находится конкретный кластер. Отображается консоль управления Cloud Eye. По умолчанию отображается информация мониторинга кластера в консоли управления Cloud Eye.

    Дополнительно вы можете указать конкретную метрику мониторинга и диапазон времени для просмотра кривой производительности.

    Note

    Позиции клавиш функций в Операция столбец динамический. Чтобы гарантировать, что всегда отображаются две клавиши функций перед Больше, любые клавиши функций, которые обычно отображаются только при наведении курсора Больше будут перемещены в позицию непосредственно перед Больше. Это корректировка происходит, если существуют функции, чьи клавиши должны быть размещены перед Больше но они не поддерживаются для текущего сайта.

Сравнение метрик мониторинга нескольких узлов

  1. В навигационной панели консоли управления Cloud Eye выберите Дашборды > Мои дашборды. Щелкните имя дашборда, для которого вы хотите добавить график. На Мои дашборды странице, которая отображается, щелкните Добавить график.
  2. На Добавить граф странице, вы можете выбрать Линейная диаграмма или Столбчатая диаграмма для отображения графика. После подтверждения правильности информации нажмите OK.

    Например, выберите Линейная диаграмма и Один вид для нескольких метрик для сравнения использования CPU трех узлов GaussDB(DWS). В следующей таблице описаны параметры.

    Таблица 2 Пример конфигурации

    Параметр

    Пример значения

    Тип ресурса

    GaussDB(DWS)

    Измерение

    Data Warehouse Node

    Monitored Object

    dws-demo-dws-cn-cn-2-1

    dws-demo-dws-cn-cn-1-1

    dws-demo-dws-dn-1-1

    Metric

    CPU Usage

  3. Click OK.

    Для выбранного My Dashboards страница, вы можете просматривать тенденцию метрик на недавно добавленном графике мониторинга. Вы можете нажать кнопку увеличения, чтобы увеличить изображение и просмотреть подробные данные сравнения метрик.

Creating Alarm Rules

GaussDB(DWS) позволяет вам настраивать правила сигнализации для мониторинга конкретных объектов и политик уведомления, обеспечивая своевременное информирование о статусе его работы.

Правило тревоги GaussDB(DWS) включает имя правила тревоги, мониторируемый объект, метрику, пороговое значение, интервал мониторинга и параметр отправки уведомления. В данном разделе описывается, как настроить правила тревоги GaussDB(DWS).

  1. Войдите в консоль GaussDB(DWS).
  2. Выберите Выделенные кластеры > Кластеры в навигационной области.
  3. Найдите строку, содержащую целевой кластер, нажмите Просмотр метрики в Операция столбце, чтобы открыть консоль управления Cloud Eye и просмотреть информацию мониторинга GaussDB(DWS).

    Состояние целевого кластера должно быть Доступен. В противном случае вы не сможете создать правила тревоги.

  4. В левой навигационной панели консоли управления Cloud Eye выберите Управление тревогами > Правила тревог.
  5. На Правила тревог странице, нажмите Создать правило тревоги в верхнем правом углу.
  6. На Создать правило тревоги странице, задайте параметры согласно подсказкам.

    1. Установите имя правила и описание.
    2. Настройте параметры тревоги согласно подсказкам.
      Таблица 3 Настройка параметров тревоги

      Параметр

      Описание

      Пример значения

      Тип ресурса

      Имя ресурса облачной службы, для которого настроено правило тревоги.

      Data Warehouse Service

      Измерение

      Измерение метрики правила тревоги. Вы можете выбрать Узлы хранилища данных или Хранилища данных.

      Узел хранилища данных

      Область мониторинга

      Область ресурсов, к которой применяется правило тревоги. Выберите Конкретные ресурсы и выберите один или несколько объектов мониторинга. Для GaussDB(DWS) выберите идентификатор кластера или идентификатор узла в отображаемом диалоговом окне.

      Конкретные ресурсы

      Триггерное правило

      Вы можете выбрать связанный шаблон, использовать существующий шаблон или при необходимости создать пользовательский шаблон.

      Создать вручную

      Шаблон

      Этот параметр действителен только когда Использовать шаблон выбран.

      Выберите шаблон для импорта. Если шаблон тревоги недоступен, нажмите Create Custom Template чтобы создать тот, который соответствует вашим требованиям.

      -

      Alarm Policy

      Этот параметр действителен только когда Create manually выбран.

      Установите политику, вызывающую тревогу. Например, вызвать тревогу, если использование CPU равно или превышает 80% в течение 3 последовательных периодов.

      Table 1 перечисляет метрики мониторинга GaussDB(DWS).

      -

      Alarm Severity

      Severity of an alarm. Valid values are Critical, Major, Низкий, и Информационный.

      Критический

    3. Настройте параметры уведомления о тревоге согласно подсказкам.

      Таблица 4 Настройка уведомлений о тревогах

      Параметр

      Описание

      Пример значения

      Уведомление о тревоге

      Определяет, уведомлять ли пользователей при срабатывании тревог. Уведомления могут отправляться по электронной почте или в виде текстовых сообщений, либо в виде запросов HTTP/HTTPS, отправляемых на серверы.

      Вы можете включить (рекомендуется) или отключить Уведомление о тревоге.

      Включить

      Период действия

      Cloud Eye отправляет уведомления только в течение периода действия, указанного в правиле тревоги.

      Например, если Период действия установлен на 00:00-8:00, Cloud Eye отправляет уведомления только в период 00:00-8:00.

      -

      Объект уведомления

      Имя темы, в которую отправляется уведомление о тревоге.

      Если вы включите Alarm Notification, вам необходимо выбрать тему. Если нужные темы недоступны, сначала создайте её, после чего будет вызван сервис SMN. Для получения подробной информации о том, как создать тему, см. Simple Message Notification User Guide.

      Для получения подробной информации о том, как создать тему, см. Simple Message Notification User Guide.

      -

      Trigger Condition

      Условие для срабатывания тревоги. Вы можете выбрать Generated alarm, Cleared alarm, или оба.

      -

    4. После завершения настройки нажмите Next.

      После создания правила тревоги, если данные метрики достигают заданного порога, Cloud Eye немедленно оповестит вас о возникновении исключения.