历史版本2 :性能排查逻辑 返回文档
编辑时间: 内容长度:图片数:目录数: 修改原因:

目录:

1. 概述编辑

1.1 应用场景

运维平台提供「系统健康观测」、「模板性能」、「首屏链路」、「调用链路」等功能,帮助用户定位到具体链路存在问题。

但是用户往往无法进一步根据链路分析存在的性能问题。

本文通过一个简单的示例,讲解如何通过链路span,对照链路字典,定位具体问题

1.2 使用思路





2. 





查看健康观测1)管理员登录运维平台,选择运维项目,点击「项目监控>健康观测」

2)查看健康指数是否低于95%:

低于95%说明工程本身存在问题

高于95%说明指定模板存在问题

2)工程存在问题

查看性能指数APDEX和请求成功率谁更低

请求成功率低:下钻看链路,要么节点挂了,要么禁止访问,要么集群组件挂了

性能指数APDEX低:定位时间,继续看健康观测,有三种情况:

用户并发高,数据库性能有问题,服务器性能

再下钻看链路,定位到具体的数据连接之类的


3)指定模板存在问题


反馈人无法给出具体信息

健康观测-问题请求列表,下钻看链路

看健康巡检-模板性能,看模板详情,解决已识别的性能风险,再下钻看链路,定位具体问题


反馈人能给出发生性能问题的模板名称、自身用户名、大致时间

直接看链路追踪-调用链路,使用这些信息,按照耗时排序,找出存在问题的链路


4)如何看链路

在具体调用链路中,找到自身耗时最大的span,点击span查看具体信息(如果看不懂,或者这个span在字典中查不到,就看他的上层信息)

看三个内容:

服务:fr、bi、引擎~~~
端点:用数据字典查,确认这个span的含义

tag信息:对应端点在数据字典提供的tag信息,定位更详细信息