Проблемы O&M
В эпоху облаков приложения в микросервисной архитектуре становятся все более разнообразными, что приводит к множеству исключений приложений. O&M приложений сталкивается со следующими проблемами:
- Распределённые приложения имеют сложные взаимосвязи. В результате трудно обеспечить нормальную работу приложений и быстро обнаружить ошибки и узкие места производительности.
- Пользователи уходят из‑за плохого опыта. Если персонал O&M не может в реальном времени обнаруживать и отслеживать сервисы с плохим опытом или своевременно диагностировать исключения приложений, опыт пользователей будет сильно ухудшен.
- В системе сервисов существует большое количество широко распределённых приложений. Вызовы между системами, регионами и приложениями происходят часто. Enterprises срочно необходимо уменьшить затраты на управление приложениями и O&M, а также повысить эффективность O&M.
Введение в APM
Управление производительностью приложений (APM) помогает персоналу O&M быстро выявлять узкие места производительности приложений и находить корневые причины ошибок, обеспечивая опыт пользователей.
Вам нужно лишь установить Agents для приложений, чтобы APM мог мониторить их всесторонне. APM может быстро находить ошибочные API и медленные API, восстанавливать параметры вызова и обнаруживать узкие места системы, облегчая онлайн‑диагностику. В текущий момент APM поддерживает Java‑приложения. В следующей таблице перечислены возможности мониторинга приложений APM.
Возможность | Описание |
|---|---|
Ненавязчивый сбор данных о производительности приложения | Вам не требуется изменять код приложения. Вместо этого достаточно развернуть пакет APM Agent и изменить параметры запуска приложения для его мониторинга. |
Мониторинг метрик приложения | APM автоматически мониторит метрики приложения, такие как JVM, JavaMethod, URL, Exception, Tomcat, HttpClient, MySQL, Redis и Kafka. |
Топология приложения | APM автоматически генерирует отношения вызовов между распределёнными приложениями на основе динамического анализа и интеллектуального вычисления информации о удалённом вызове процедур (RPC). |
Трассировка | После подключения нескольких приложений к APM, APM автоматически отбирает запросы и собирает отношения вызовов между сервисами и статус здоровья промежуточных вызовов для автоматической трассировки. |
Анализ детализации метрик | APM позволяет выполнять детализацию и анализ метрик, таких как время отклика приложения, количество запросов и уровень ошибок, а также просматривать метрики по приложениям, компонентам, среде, базе данных, промежуточному ПО или другим измерениям. |
Трассировка ошибочных или медленных URL | APM определяет ошибочные или медленные URL на основе трассировки URL и автоматически связывает их с соответствующими API, такими как API SQL и MQ. |
- Доступ к APM: приложения должны реализовать аутентификацию AK/SK для подключения к APM.
- Сбор данных O&M: APM может собирать данные о приложениях, базовых ресурсах и пользовательском опыте от Agents в режиме без навязчивого вмешательства.
- Реализация сервиса: APM поддерживает мониторинг метрик приложений, топологию приложений, трассировку и интеллектуальное формирование отчётов о тревогах.
- Расширение сервиса:
- Вы можете быстро диагностировать исключения производительности приложений на основе топологии приложения и трассировки APM, а также принимать решения на основе метрик O&M приложений из Application Operations Management (AOM).
- После выявления узких мест производительности вы можете использовать Cloud Performance Test Service (CPTS) для выполнения ассоциативного анализа и создания отчетов о производительности.
- APM использует интеллектуальные алгоритмы для изучения исторических данных метрик. Затем он может ассоциировать метрики для анализа из нескольких измерений, извлекать контекстные данные как нормальных, так и аномальных сервисов для сравнения и выявлять корневые причины с помощью кластерного анализа.
Преимущества

Подключается к приложениям без необходимости изменения кода и собирает данные в неинвазивном режиме.
- APM Agents собирают данные о вызовах сервисов, инвентаре сервисов и KPI вызовов.

Обеспечивает высокую пропускную способность (сотни миллионов API‑вызовов), гарантируя премиальный опыт.

Предоставляет открытые API для запросов данных O&M, предлагает стандарты сбора и поддерживает независимую разработку.

Отчитывается о тревогах, используя искусственный интеллект (AI) для обнаружения пороговых значений и машинное обучение на основе исторических базовых данных, и поддерживает анализ корневой причины.
- O&M Проблемы
- Введение в APM
- Преимущества