1. 概述
1.1 版本
运维平台版本 | 功能变更 |
---|---|
V1.5.5 | - |
V1.5.7 | 1)查询界面新增「重置」按钮,方便重置查询 2)调用链路列表展示优化,支持展开收起,方便放大记录明细区 |
V1.6.0 | 1)优化「收起侧边列表」按钮交互 2)支持点击复制traceID |
V1.7.0 | 对于使用elasticsearch套件获取和存储日志的运维项目,在查看链路详情时,支持获取日志到本地 |
V1.8.0 | 查询界面新增筛选项:端点、状态、实例 |
V1.11.0 | 1)调用链路详情新增「分析汇总」视图,帮助用户快速洞察耗时分布,汇总展示链路span信息 2)调用链路详情新增「链路信息」按钮,汇总展示链路关键信息,减少查询时间 3)调用链路列表新增「FGC」标识,标记链路时间范围内是否发生FullGC |
V1.12.0 | 若某个调用链路所在session有相关首屏链路数据,则支持联动跳转「查看首屏链路」 |
V1.14.0 | 1)调用链路详情「列表」视图下,链路信息中,新增「自助数据集」字段,若有即可查看 2)调用链路详情「列表」视图,新增「span关键字查询」功能,支持搜索包含指定关键字的span 3)调用链路详情「分析汇总」视图下,支持点击span名称跳转至「列表」视图下,以名称作为关键词进行搜索 |
V1.15.0 | 1)支持自定义链路追踪数据留存天数,满足个性化分析诉求 2)支持手动清空运维项目链路数据,防止磁盘不足引起异常 |
V2.0 | 支持导出链路数据 |
1.2 功能简介
当仪表板/报表出现卡慢情况时,管理员无需被动的等待用户反馈问题,可使用「链路追踪」功能,帮助用户对查询请求中的链路明细进行采集和分析。
支持根据ID、时间等,筛选请求,进一步定位分析慢的请求,可以进行问题定位,精确到网络波动、数据库性能、配置库、复杂资源、资源不足等问题。
2. 使用前提
使用链路追踪功能前,请先确保开启链路追踪、配置全局设置等。
详情请参见:链路追踪使用前提
3. 配置查询条件
1)管理员登录运维平台,选择运维项目。点击「链路追踪>调用链路」。
2)选择项目组件,仅支持对项目中的fr、bi和nginx组件进行链路追踪。
3)点击「筛选」,配置查询条件,点击「查询」即可。
支持的查询条件如下表所示:
查询条件 | 简介 |
---|---|
查询时间 | 说明:筛选所有在此时间范围内开始的查询 可选项:支持选择当前日期过去5天范围内,但查询区间跨度不得大于3天 默认值:当前时间前半小时内 |
查询ID | 说明:查找对应session相关记录 可选项:时间范围内的所有sessionID 默认值:为空,即展示全部 |
调用链路ID | 说明:查找对应traceID的调用链路 可选项:时间范围内的所有traceID 默认值:为空,即展示全部 |
用户 | 说明:筛选该用户触发的所有查询 可选项:所有有记录的用户 默认值:为空,即展示全部 |
访问内容 | 说明:筛选查询对象对应的查询记录 可选项:
默认值:为空,即展示全部 |
端点耗时 | 说明:筛选调用链路耗时在区间内的查询记录 可选项:非负整数,为空则表示不限制上限/下限 默认值:为空,即展示全部 |
端点 | 说明:筛选调用链路类型 可选项:时间范围内的所有端点 默认值:为空,即展示全部 |
状态 | 说明:筛选调用链路成功/失败的情况 可选项:
默认值:为空,即展示全部 |
实例 | 说明:筛选运维项目中的节点对应的链路,仅集群工程支持该筛选项 可选项:选择集群中的各个节点 默认值:为空,即展示全部 |
更多 | 说明:筛选所有标签等于所选值条件的查询 可选项:sessionId、reportId、dec.user.name、fr.domain、fr.cmd、db.type、http.method、http.status_code、db.instance(后五项不可同时选中) 默认值:为空,即展示全部 |
重置 | 说明:点击该按钮,即可一键清空以上所有查询条件 |
4. 链路结果展示
查询后的界面如下图所示:
序号 | 说明 | |
---|---|---|
1 | 链路排序方式 | 支持对查询所得的链路结果进行排序:
|
2 | 数据下载按钮 | 对于内网用户,可将链路数据导出给帆软技术支持,协助排查问题 点击可导出 排序后的前100条链路数据 |
3 | 链路列表 | 展示每一条调用链路的缩略信息: 访问内容:post/get请求、URL 链路耗时:黄色代表请求超过10s,红色代表请求报错,其他为灰色 FGC标识:标记链路时间范围内是否发生FullGC 时间:链路发生时间 |
4 | 列表折叠按钮 | 点击该按钮,支持折叠展开左侧链路列表区域 |
5 | 单条链路详情 | 1)视图切换 以列表/分析汇总视图展示每条span的详情,左上角支持切换视图 2)调用链路ID 右上角显示链路ID,点击即可复制 3)获取日志 使用前提:该运维项目使用elasticsearch套件获取和存储日志 使用说明:点击按钮将下载包含对应TraceID的运维日志到本地 4)查看首屏链路 若某个调用链路所在session有相关首屏链路数据,则支持联动跳转查看首屏链路 |
4.1 列表
1)traceID复制按钮:点击可快速复制traceID,用于日志查询。
2)获取日志按钮
使用前提:该运维项目使用elasticsearch套件获取和存储日志
使用说明:点击按钮将下载包含对应TraceID的运维日志到本地
3)耗时筛选:支持使用控件筛选满足耗时范围的链路
4)span关键字查询:支持搜索包含指定关键字的span
5)以明细表形式展示该链路的明细span信息,点击可展示每条span的更详细信息。
6)点击「链路信息」按钮,无需逐条查看span,即可展示系统自动提炼的调用链路的最关键信息。
4.2 分析汇总
分析汇总界面分为两个部分:
1)耗时分布:帮助用户一眼看到耗时分布的情况
分为两类:按peer取数耗时、其他
点击具体类别可以联动筛选下面的span汇总
2)span汇总:以汇总维度展示链路span的汇总信息
内容 | 说明 |
---|---|
span | span信息 |
调用次数 | 调用的次数 |
总耗时 | 所有调用的耗时总和,单位ms |
平均耗时 | 总耗时/调用次数,单位ms |
耗时占比 | 在所有耗时中,该span的耗时占比 按照链路耗时占比降序排列 |
类型 | peer取数耗时/其他 |
3)支持点击span名称跳转至「列表」视图下,以名称作为关键词进行搜索。