1. 概述
FineOps运维平台提供健康观测与链路追踪功能,帮助管理员定位用户查看、分析仪表板/报表的性能卡慢问题。
本文将基于不同的使用场景,讲述FineOps如何对「FineReport模板/FineBI仪表板」的性能问题进行定位。
2. 应用场景
问题场景 | 历史解决方案 | FineOps解决方案 |
---|---|---|
用户向管理员反馈,感觉系统使用卡慢 | 1)无法衡量和定位问题 2)需要被动的等待用户反馈问题 | 排查步骤: 查看「系统健康观测」
解决效果: 1)管理员可以自行查看系统健康观测,在用户反馈前主动发现系统出现了卡慢,无需被动等待 2)将用户实际体验,以数据形式准确展示出来 |
在系统健康观测,发现性能分数过低时 | 管理员可以拿日志、打堆栈,自行排查问题 | 排查步骤: 查看「监控仪表板」,检查系统是否发生了GC,或CPU已满 解决效果: 快速定位到GC等问题 |
用户使用某种仪表板/模板时,感觉卡慢 | 1)需要被动的等待用户反馈问题 2)需要拿日志自行分析 | 排查步骤: 1)无需等待用户反馈,检查「系统健康观测」的看板图表异常点 2)联动跳转至「首屏链路」分析 查看该时间段内用户查看了哪些报表,查看用户的查询耗时等 对于标黄展示的首屏链路,代表该首屏链路耗时或其关联的调用链路耗时超过了10S 3)建议再联动跳转至「调用链路」分析,进一步定位分析慢的请求,可以进行问题定位,精确到网络波动、数据库性能、配置库、复杂资源、资源不足等问题 解决效果: 还原用户真实体验,并将定位时间缩短至10分钟内 |
排查步骤: 1)无需等待用户反馈,检查「系统健康观测」捕捉到的性能过慢(>10s)的请求 2)联动跳转至「首屏链路」分析 查看该报表对应的查看用户和使用耗时等 对于标黄展示的首屏链路,代表该首屏链路耗时或其关联的调用链路耗时超过了10S 3)建议再联动跳转至「调用链路」分析,进一步定位分析慢的请求,可以进行问题定位,精确到网络波动、数据库性能、配置库、复杂资源、资源不足等问题 解决效果: 还原用户真实体验,并将定位时间从缩短至10分钟内 |