Managed Trino собирает метрики кластера и отправляет их в сервис «Мониторинг». Метрика — показатель инфраструктуры и приложений в реальном времени. Например, использование оперативной памяти или количество запросов к контейнеру.
Следить за изменением метрик в реальном времени или анализировать накопленные метрики в динамике можно с помощью дашбордов. Дашборды содержат наборы виджетов для отслеживания различных параметров. Виджеты отображают информацию, полученную с помощью метрик, в виде графика или текста.
Для Managed Trino существует сервисный дашборд с преднастроенным набором виджетов. Он доступен в личном кабинете в разделе Мониторинг.
Сервсиный дашборд Managed Trino содержит следующие виджеты:
Название виджета | Описание |
|---|---|
Число активных нод | Количество активных узлов (нод) в кластере Managed Trino. Показывает число работающих координаторов и воркеров, доступных для выполнения запросов. С помощью этих данных оценивается доступная вычислительная мощность кластера. |
Число node с ошибкой | Количество узлов, находящихся в процессе корректного завершения работы (graceful shutdown). Узлы в этом состоянии не принимают новые задачи, но завершают выполнение текущих. |
Число выполняемых запросов | Текущее количество выполняющихся запросов в кластере. Показывает активную нагрузку на систему в реальном времени. |
Число отмененных запросов | Общее количество отмененных пользователем или автоматически по истечении тайм-аута запросов с момента запуска кластера. |
Число выполненных запросов | Общее количество выполненных запросов в кластере. |
Число запросов в очереди (queued) | Когда достигнут лимит на параллельное выполнение, запросы попадают в очередь. Виджет показывает, сколько запросов ожидают выполнения в очереди. Постоянно высокое число ожидающих запросов означает, что в кластере недостаточно вычислительных ресурсов. |
Число запросов с ошибкой | Общее количество запросов, завершившихся с ошибкой. Включает как внутренние ошибки Trino, так и синтаксические или логические ошибки в запросах пользователя. |
Продолжительность выполнения запросов, мс | Время выполнения завершенных запросов в миллисекундах. |
Объем входящих данных, байт | Общий объем данных, прочитанных всеми задачами с момента запуска кластера. Показывает суммарный объем обработанных входных данных и помогает оценить нагрузку на систему хранения. |
Объем исходящих данных, байт | Общий объем данных, записанных всеми задачами с момента запуска. Отражает объем результатов запросов и промежуточных данных и помогает оценить нагрузку на сеть и выходные системы хранения. |
Объем wall, байт | Суммарная скорость чтения входных данных в байтах в секунду за все время работы кластера. Используется для анализа производительности операций чтения и пропускной способности систем хранения данных. |
Загрузка CPU, % | Загрузка процессора в процентах. |
Загрузка RAM, % | Загрузка оперативной памяти в процентах. |
Загрузка RAM (Gb), ГБ | Загрузка оперативной памяти в гигабайтах. |
Количество нод | Количество узлов в состоянии «Ready», на которых развернут Trino. |
Дашборд поддерживает следующие настройки и опции:
Выбор периода сбора данных. По умолчанию отображаются данные за последние 2 часа.
Выбор интервала автообновления данных. По умолчанию данные обновляются каждые 5 минут.
Выгрузка графика в PNG-файл.
Просмотр графика в развернутом режиме.
Подробное описание и инструкции по настройке дашборда читайте в документации сервиса «Мониторинг»:
Сервисные дашборды — работа с преднастроенными дашбордами.
Пользовательские дашборды — создание пользовательских дашбордов с кастомными виджетами и метриками.
Алерты — настройка алертов и уведомлений об изменении в метриках.
Вычисляемые метрики — создание сложных запросов на основе существующих метрик.