- tocdepth
2
Мониторинг кластера
Managed Kubernetes собирает метрики кластера и отправляет их в сервис Мониторинг, где можно самостоятельно настраивать необходимые дашборды и виджеты. Подробное описание и инструкции по настройке смотрите в руководстве пользователя по Мониторингу.
Сбор метрик
Чтобы получать метрики объектов кластера и системные метрики, в кластере обязательно должны быть установлены плагины Node Exporter и Kube State Metrics. Если при создании кластера активирована опция Мониторинг, плагины установятся автоматически. По умолчанию опция активирована.
Если вы не хотите отправлять метрики в сервис Мониторинг, но планируете их собирать для другой системы визуализации данных, при создании кластера отключите опцию Мониторинг и выберите плагины Node Exporter и Kube State Metrics вручную.
Описание метрик, которые собирают плагины, читайте в документации Node Exporter и Kube State Metrics.
Преднастроенные виджеты
Для наблюдения за состоянием кластера, рабочих узлов и контейнеров в Managed Kubernetes настроены виджеты. Они отображают показатели кластера за выбранный период. Как посмотреть виджеты для каждого кластера, читайте в разделе Наблюдать за состоянием кластера.
Виджеты, настроенные в Managed Kubernetes, описаны ниже.
Кластер
В таблице описаны виджеты, которые настроены по умолчанию в Managed Kubernetes на вкладке Кластеры.
Виджет |
Описание |
Легенда |
---|---|---|
Global CPU usage (%) |
Общая загрузка процессора всеми подами, сервисами и системными процессами в кластере. Показывает, какая часть процессора используется для выполнения задач по сравнению с запрошенным CPU. Помогает оценить, насколько эффективно распределяются ресурсы в кластере, и есть ли риск недостатка ресурсов для работы приложений. |
|
Global RAM Usage (%) |
Общий процент использования оперативной памяти всеми подами, сервисами и системными процессами в кластере. Показатель дает представление о том, как ресурсы оперативной памяти распределяются и используются в кластере, и помогает определить, достаточно ли памяти для текущих и будущих задач. |
|
CPU usage (cores) |
Использование процессорных ресурсов в ядрах процессора для подов, контейнеров или кластера. Позволяет понять, сколько процессорного времени, выраженного в ядрах, реально используется приложениями и службами, работающими в кластере. |
|
RAM Usage (Gb) |
Общий объем оперативной памяти (RAM), используемой всеми подами, сервисами и системными процессами в кластере. Показатель дает представление о том, как ресурсы оперативной памяти распределяются и используются в кластере. |
|
Kubernetes Resource Count |
Количественный показатель, который отражает общее количество ресурсов в кластере. |
|
OOM Events by namespace |
Общее число рестартов подов, вызванных превышением лимитов по памяти или общей нехваткой памяти на узле, по каждому пространству имен. |
|
Container Restarts by namespace |
Количество перезапусков контейнеров в пространстве имен за выбранный временной промежуток. |
Рабочие узлы
В таблице описаны виджеты, которые настроены по умолчанию в Managed Kubernetes на вкладке Узлы. Посмотреть статистику можно по каждому рабочему узлу.
Виджет |
Описание |
Легенда |
---|---|---|
CPU Usage |
Загрузка процессора (CPU) в процентах на рабочем узле, исключая время простоя и другие режимы, которые не отражают активную работу процессора. |
Нагрузка по каждому ядру. |
Load Average |
Средняя загрузка системы. |
|
Memory usage (Gb) |
Используемая память в ГБ. |
|
Network Usage |
Скорость передачи трафика в Mb/s. |
|
Disk I/O (KB/s) |
Скорость чтения и записи на дисковые устройства в KB/s. |
|
Pods per Node |
Количество подов на рабочем узле. |
Контейнеры
В таблице описаны виджеты, настроенные для каждого контейнера. Посмотреть статистику можно по каждому namespace и поду в выбранном namespace.
Виджет |
Описание |
Легенда |
---|---|---|
CPU usage by container |
Потребление CPU каждым контейнером за последнюю минуту. |
|
Memory Usage by container (Gb) |
Потребление оперативной памяти каждым контейнером в ГБ. |
|
Network-Bandwidth (KiB) |
Скорость приема и передачи сетевых данных контейнерами за минуту. |
|
Network-Packets Rate |
Общая скорость приема и передачи сетевых пакетов контейнерами за последнюю минуту. |
|
Network-Packets Dropped |
Общее количество отброшенных пакетов за минуту. |
|
Network-Errors (p/s) |
Общее количество пакетов с ошибками за минуту. |
|
для Dev & Test