1. 概述编辑
1.1 版本
运维平台版本 | 功能变更 |
---|---|
V1.2 | - |
V1.4 | 日志分析功能拆分,分为「性能堆栈分析」和「日志分析」两个模块 |
1.2 功能简介
运维平台提供「日志分析」功能,帮助用户对错误堆栈、出错日志、业务分析日志进行分析并给出相关改进意见。
注:仅支持对运维平台绑定的「运维项目」的日志进行分析,不支持直接上传日志文件分析。
2. 性能堆栈分析编辑
性能堆栈日志分析,是对jstack、histo、gc和top-H内容进行分析。
2.1 进行日志分析
性能堆栈日志分析,可由手动触发/自动触发。
2.1.1 手动触发
管理员登录运维平台,点击「日志管理>日志分析>性能堆栈分析」。
选择需要进行分析的运维项目,点击「开始分析」,即可触发一次性能堆栈日志分析。
若为集群环境,每个节点都会生成一份分析记录。
注:若分析请求过于频繁,则提示「分析请求太频繁啦,请稍等一分钟后再重新尝试」。
2.1.2 自动触发
若运维项目的宕机处理策略设置中,开启了「自动导出内存堆栈」。运维项目若宕机重启,触发了自动打堆栈,则会同时触发一次性能堆栈日志分析。
若为集群环境,每个节点都会生成一份分析记录。
2.2 查看分析结果
手动/自动触发的分析结果,以明细表形式展示在「日志分析历史记录」中。
点击对应分析结果后的「查看按钮」,即可查看本次分析的具体结果。
性能堆栈分析结果示例,包括分析建议、内存状态和明细、GC状态和耗时。如下图所示:
2.3 管理分析结果
日志分析历史记录中,以明细表形式显示所有手动/自动触发的分析结果。
1)分析记录以明细表形式展示,展示内容包括:应用名、节点名、操作时间、操作者、分析时间区间、分析结果。
若手动触发,操作者和操作IP为空。
2)支持选中单个分析记录删除,支持批量删除多个分析记录,支持清空全部历史记录。
3)点击分析记录中的「查看」按钮,即可在新标签页打开具体的分析结果。
4)日志分析历史记录最多只保留最近50条记录。
5)若运维项目为集群环境,每个节点都会生成一份分析结果。
3. 日志分析编辑
日志分析,支持对业务和出错日志进行分析。
日志类别 | 简介 |
---|---|
出错日志 | 出错日志基于fanruan.log进行分析 出错日志输出可疑异常报错、特定业务报错 支持FR、BI、平台等多模块多策略的分析结果汇总 |
业务分析 | 业务分析基于fanruan.log进行分析 业务性能日志输出BI耗时分析、FR计算耗时等 |
3.1 进行日志分析
管理员登录运维平台,点击「日志管理>日志分析>日志分析」。
1)步骤一:选择「运维项目」和「集群节点」
仅支持对运维平台绑定的「运维项目」的日志进行分析,不支持直接上传日志文件分析。
2)步骤二:选择「日志类别」
支持两种日志类别:出错日志、业务分析。
3)步骤三:设置「分析时段」
默认分析时段为当前时间前一小时。
FR仅支持分析当前时间一周范围内日志、最大区间为1小时,最小为1分钟。
BI仅支持分析当前时间一周范围内日志、最大区间为1天,最小为1分钟。
注:若分析请求过于频繁,则提示「分析请求太频繁啦,请稍等一分钟后再重新尝试」。
3.2 查看分析结果
出错日志和业务分析的分析结果,以明细表形式展示在「日志分析历史记录」中。
点击对应分析结果后的「查看按钮」,即可查看本次分析的具体结果。
1)出错日志分析结果示例
2)业务分析分析结果示例
3.3 管理分析结果
日志分析历史记录中,以明细表形式显示所有出错日志和业务分析的分析结果。
1)分析记录以明细表形式展示,展示内容包括:应用名、日志类别、节点名、操作时间、分析时间区间、分析结果。
2)支持选中单个分析记录删除,支持批量删除多个分析记录,支持清空全部历史记录。
3)点击分析记录中的「查看」按钮,即可在新标签页打开具体的分析结果。
4)日志分析历史记录最多只保留最近50条记录。