Advanced
Тема интерфейса
MapReduce Service

Настройка Auto Scaling для кластера MRS

Эта статья полезна?
Язык статьи: Русский
Показать оригинал
Страница переведена автоматически и может содержать неточности. Рекомендуем сверяться с английской версией.

В сценариях приложений big data, особенно при анализе и обработке данных в режиме реального времени, количество узлов кластера необходимо динамически регулировать в соответствии с изменениями объёма данных для обеспечения надлежащих ресурсов. Функция Auto Scaling сервиса MRS позволяет кластерам автоматически масштабироваться наружу или внутрь в зависимости от нагрузки кластера.

  • Правила Auto Scaling: Вы можете увеличивать или уменьшать узлы Task в зависимости от нагрузки кластера в реальном времени. Auto Scaling будет инициировано при изменении объёма данных, однако возможны некоторые задержки.
  • План ресурсов (установка количества узлов Task в зависимости от временного диапазона): Если объём данных меняется периодически, вы можете создавать планы ресурсов для изменения размеров кластера до изменения объёма данных, тем самым избегая задержек при увеличении или уменьшении ресурсов.

Вы можете настроить либо правила Auto Scaling, либо планы ресурсов, либо оба, чтобы инициировать Auto Scaling.

Сценарий

В следующем примере описывается, как использовать одновременно правила Auto Scaling и планы ресурсов:

Служба обработки в реальном времени наблюдает нестабильный рост объёма данных с 7:00 до 13:00 в понедельник, вторник и субботу. Например, от 5 до 8 узлов задач требуется с 7:00 до 13:00 в понедельник, вторник и субботу, а за пределами этого периода требуется от 2 до 4.

Вы можете задать правило автоматического масштабирования на основе плана ресурсов. Когда объём данных превышает ожидаемое значение, количество узлов задач меняется в зависимости от нагрузки ресурсов, не превышая диапазон узлов, указанный в плане ресурсов. При срабатывании плана ресурсов количество узлов изменяется в пределах указанного диапазона с минимальным влиянием. То есть увеличьте количество узлов до верхнего предела и уменьшите до нижнего предела.

Добавление узла задачи

Вы можете масштабировать кластер MRS, вручную добавляя узлы задач.

Чтобы добавить узел задачи в пользовательский кластер, выполните следующие действия:

  1. На странице сведений о кластере нажмите Узлы вкладку и нажмите Добавить группу узлов. Эта Добавить группу узлов страница отображается.
  2. Выбрать Задача дляТип узла. Оставьте значение по умолчанию NM для Деплой Роли. Для развертывания роли NodeManager тип узла должен быть Задача. Установите другие параметры по необходимости.

    Рисунок 1 Добавление группы узлов задачи


Чтобы добавить узел задачи в нестандартный кластер, выполните следующие действия:

  1. На странице сведений о кластере нажмите Узлы вкладку и нажмите Настроить узел задачи. Настроить узел задачи страница отображается.
  2. На Настройка узла задачи страница, установить Тип узла, Характеристики экземпляра, Узлы, Системный диск. Кроме того, если Добавить диск с данными включено, настройте тип хранилища, размер и количество дисков с данными.

  3. Нажмите OK.

Использование правил Auto Scaling и ресурсных планов вместе

  1. Войдите в консоль управления MRS.
  2. На Активные кластеры страница, и нажмите название кластера для выполнения операций. Страница сведений о кластере отображается.
  3. На отображаемой странице нажмите Auto Scaling вкладку.
  4. Нажмите Создать политику Auto Scaling и задайте Диапазон узлов до 2-4.
  5. Настройте план ресурсов.

    1. Нажмите Настроить диапазон узлов для конкретного диапазона времени в Диапазон по умолчанию.
    2. Настройте Диапазон времени и Диапазон узлов параметры.

      Диапазон времени: Установите его в 07:00-13:00.

      Диапазон узлов: Установите значение 5-8.

  6. Настройте правило автоматического масштабирования.

    1. Выберите Масштабирование наружу.
    2. Нажмите Добавить правило справа.

      Имя правила: default-expand-2.

      Если: Выберите объекты правила и ограничения из выпадающих списков, например, YARNAppRunning больше 75.

      Длительность: Установите значение 1 пяти‑минутный период.

      Добавить: Установите 1 узел.

      Период отката: Установите 20 минут.

    3. Нажмите OK.

  7. Выберите Я согласен разрешить MRS масштабировать узлы наружу или внутрь в соответствии с вышеуказанным правилом.
  8. Нажмите OK.

Справочная информация

При добавлении правила вы можете обратиться к Таблица 1 для настройки соответствующих метрик.

Note
  • Гибридные кластеры поддерживают все метрики анализа и потоковых кластеров.
  • Точность различных типов значений в Таблица 1 следующее:
    • Целое: целое
    • Процент: 0.01
    • Соотношение: 0.01
Таблица 1 Метрики Auto scaling

Тип кластера

Метрика

Тип значения

Описание

Потоковый кластер

StormSlotAvailable

Целое

Количество доступных Storm слотов.

Диапазон значений: 0 до 2147483646.

StormSlotAvailablePercentage

Percentage

Процент доступных слотов Storm, то есть доля доступных слотов от общего количества слотов.

Диапазон значений: 0 до 100.

StormSlotUsed

Integer

Количество используемых слотов Storm.

Диапазон значений: 0 до 2147483646.

StormSlotUsedPercentage

Percentage

Процент используемых слотов Storm, то есть доля используемых слотов от общего количества слотов.

Диапазон значений: 0 до 100.

StormSupervisorMemAverageUsage

Integer

Среднее потребление памяти процессом Supervisor в Storm.

Диапазон значений: 0 до 2147483646.

StormSupervisorMemAverageUsagePercentage

Percentage

Средний процент использованной памяти процесса Supervisor в Storm от общей памяти системы.

Диапазон значений: 0 до 100.

StormSupervisorCPUAverageUsagePercentage

Процент

Средний процент использованных CPU процесса Supervisor в Storm от общего количества CPU.

Диапазон значений: [0, 6000].

Кластер анализа

YARNAppPending

Целое число

Количество ожидающих задач в Yarn.

Диапазон значений: 0 до 2147483646.

YARNAppPendingRatio

Соотношение

Соотношение ожидающих задач в Yarn, то есть отношение ожидающих задач к запущенным задачам в Yarn.

Диапазон значений: 0 до 2147483646.

YARNAppRunning

Целое число

Количество запущенных задач на Yarn.

Диапазон значений: 0 до 2147483646.

YARNContainerAllocated

Целое

Количество контейнеров, выделенных YARN.

Диапазон значений: 0 до 2147483646.

YARNContainerPending

Целое

Количество ожидающих контейнеров на Yarn.

Диапазон значений: 0 до 2147483646.

YARNContainerPendingRatio

Отношение

Отношение ожидающих контейнеров в Yarn, то есть отношение ожидающих контейнеров к запущенным контейнерам в Yarn.

Диапазон значений: 0 до 2147483646.

YARNCPUAllocated

Целое

Количество виртуальных процессоров (vCPUs), выделенных Yarn.

Диапазон значений: 0 до 2147483646.

YARNCPUAvailable

Integer

Количество доступных vCPU на Yarn.

Диапазон значений: 0 до 2147483646.

YARNCPUAvailablePercentage

Процент

Процент доступных vCPU на Yarn, то есть отношение доступных vCPU к общему количеству vCPU.

Диапазон значений: 0 до 100.

YARNCPUPending

Integer

Количество ожидающих vCPU на Yarn.

Диапазон значений: 0 до 2147483646.

YARNMemoryAllocated

Integer

Память, выделенная Yarn. Единица измерения — MB.

Диапазон значений: 0 до 2147483646.

YARNMemoryAvailable

Integer

Доступная память на Yarn. Единица измерения — MB.

Диапазон значений: 0 до 2147483646.

YARNMemoryAvailablePercentage

Процент

Процент доступной памяти в Yarn, то есть отношение доступной памяти к общей памяти в Yarn.

Диапазон значений: 0 до 100.

YARNMemoryPending

Целое

Ожидающая память в Yarn.

Диапазон значений: 0 до 2147483646.

При добавлении плана ресурсов вы можете задать параметры, ссылаясь на Таблица 2.

Таблица 2 Элементы конфигурации плана ресурсов

Параметр

Описание

Эффективно с

Дата начала действия плана ресурсов. Ежедневно выбирается по умолчанию. Вы также можете выбрать один или несколько дней с понедельника по воскресенье.

Диапазон времени

Время начала и время окончания плана ресурса точны до минут, значения находятся в пределах от 00:00 до 23:59. Например, если план ресурса начинается в 8:00 и заканчивается в 10:00, задайте этот параметр значение 8:00-10:00. Время окончания должно быть минимум на 30 минут позже времени начала. Диапазоны времени, настроенные для разных планов ресурсов, не могут перекрываться.

Диапазон узлов

Количество узлов в плане ресурса находится в диапазоне от 0 до 500. В течение диапазона времени, указанного в плане ресурсов, если количество узлов задачи меньше указанного минимального количества узлов, оно будет увеличено до указанного минимального значения диапазона узлов за один раз. Если количество узлов задачи превышает максимальное количество узлов, указанное в плане ресурсов, функция автошкалирования уменьшит количество узлов задачи до максимального значения диапазона узлов за один раз. Минимальное количество узлов должно быть меньше или равно максимальному количеству узлов.