tocdepth

2

Горизонтальное масштабирование подов

Managed Kubernetes поддерживает горизонтальное масштабирование подов — Horizontal Pod Autoscaler.

Горизонтальное масштабирование подов — это автоматическое изменение количества подов в зависимости от загрузки виртуального процессора и оперативной памяти.

Использование горизонтального масштабирования подов позволяет:

  • справиться с возросшей нагрузкой, увеличивая количество подов;

  • освободить рабочие узлы для других приложений, удаляя поды, если нагрузка низкая.

Ограничения и особенности

Чтобы начать горизонтальное масштабирование подов, необходимо установить плагин Metrics Server. Он собирает и агрегирует показатели ресурсов узлов и подов (CPU и RAM), полученные от kubelet, и предоставляет их в Kubernetes API Server через Metrics API.

Metrics Server можно установить сразу при создании кластера на шаге «Интеграция и плагины» или в уже созданном кластере.

Настроить горизонтальное масштабирование можно для Deployment, StatefulSet и ReplicaSet. Не используйте горизонтальное масштабирование подов для рабочих нагрузок, которые невозможно масштабировать, например Daemon Sets.

Для каждой рабочей нагрузки необходимо настроить отдельный Horizontal Pod Autoscaler. Он периодически проверяет заданные показатели на соответствие установленным пороговым значениям и автоматически изменяет форму рабочей нагрузки.

Пример настройки

Пример настройки Horizontal Pod Autoscaler см. в сценарии Развертывание Deployment с горизонтальным масштабированием подов.

Запустили Evolution free tier
для Dev & Test
Получить