微服务治理-服务监控
微服务治理-服务监控 服务监控(Metrics Monitoring)用于对系统运行状态进行持续量化观测,通过指标数据(QPS、RT、错误率、资源使用率等)实现对微服务系统健康状况的实时评估与告警。 一、介绍 1.1 为什么需要监控? 链路追踪解决的是:“这一次请求为什么慢?” 但通常还需要知道:“整个系统现在健康吗?” 比如:系统很卡问题 你需要判断: 是 CPU 高了? 是数据库慢了? 是某个接口爆了? 还是流量暴涨? 1.3 监控解决什么问题? 一句话总结: 把系统运行状态数字化 + 可视化 + 可告警 核心能力: 实时状态 历史趋势 异常检测 自动告警 容量规划 1.4 三大核心指标类型 System Metrics(系统指标) Application Metrics(应用指标) Business Metrics(业务指标) 二、核心指标(Metrics) 2.1 系统指标(System Metrics) 关注机器层面: CPU 使用率 内存使用率 磁盘 IO 网络流量 2.2 应用指标(Application Metrics) 关注服务本身: QPS(每秒请求数) RT(响应时间) 错误率(Error Rate) 并发连接数 2.3 业务指标(Business Metrics) 关注业务结果: 下单成功率 支付成功率 注册转化率 GMV 三、应用 Prometheus + Grafana + Alertmanager轻量级监控告警系统