微服务治理-服务监控

服务监控(Metrics Monitoring)用于对系统运行状态进行持续量化观测,通过指标数据(QPS、RT、错误率、资源使用率等)实现对微服务系统健康状况的实时评估与告警。

一、介绍

1.1 为什么需要监控?

链路追踪解决的是:“这一次请求为什么慢?”

但通常还需要知道:“整个系统现在健康吗?”

比如:系统很卡问题

你需要判断:

  • 是 CPU 高了?
  • 是数据库慢了?
  • 是某个接口爆了?
  • 还是流量暴涨?

1.3 监控解决什么问题?

一句话总结:

把系统运行状态数字化 + 可视化 + 可告警

核心能力:

  • 实时状态
  • 历史趋势
  • 异常检测
  • 自动告警
  • 容量规划

1.4 三大核心指标类型

  • System Metrics(系统指标)
  • Application Metrics(应用指标)
  • Business Metrics(业务指标)

二、核心指标(Metrics)

2.1 系统指标(System Metrics)

关注机器层面:

  • CPU 使用率
  • 内存使用率
  • 磁盘 IO
  • 网络流量

2.2 应用指标(Application Metrics)

关注服务本身:

  • QPS(每秒请求数)
  • RT(响应时间)
  • 错误率(Error Rate)
  • 并发连接数

2.3 业务指标(Business Metrics)

关注业务结果:

  • 下单成功率
  • 支付成功率
  • 注册转化率
  • GMV

三、应用

Prometheus + Grafana + Alertmanager轻量级监控告警系统