历史版本2 :性能排查逻辑 返回文档
编辑时间:
内容长度:图片数:目录数:
修改原因:
目录:
1. 概述编辑
1.1 应用场景
运维平台提供「系统健康观测」、「模板性能」、「首屏链路」、「调用链路」等功能,帮助用户定位到具体链路存在问题。
但是用户往往无法进一步根据链路分析存在的性能问题。
本文通过一个简单的示例,讲解如何通过链路span,对照链路字典,定位具体问题
1.2 使用思路
2.
查看健康观测 | 1)管理员登录运维平台,选择运维项目,点击「项目监控>健康观测」 2)查看健康指数是否低于95%: 低于95%说明工程本身存在问题 高于95%说明指定模板存在问题 2)工程存在问题 查看性能指数APDEX和请求成功率谁更低 请求成功率低:下钻看链路,要么节点挂了,要么禁止访问,要么集群组件挂了 性能指数APDEX低:定位时间,继续看健康观测,有三种情况: 用户并发高,数据库性能有问题,服务器性能 再下钻看链路,定位到具体的数据连接之类的 3)指定模板存在问题 反馈人无法给出具体信息 看健康观测-问题请求列表,下钻看链路 看健康巡检-模板性能,看模板详情,解决已识别的性能风险,再下钻看链路,定位具体问题 反馈人能给出发生性能问题的模板名称、自身用户名、大致时间 直接看链路追踪-调用链路,使用这些信息,按照耗时排序,找出存在问题的链路 4)如何看链路 在具体调用链路中,找到自身耗时最大的span,点击span查看具体信息(如果看不懂,或者这个span在字典中查不到,就看他的上层信息) 看三个内容: 服务:fr、bi、引擎~~~ tag信息:对应端点在数据字典提供的tag信息,定位更详细信息 | |