1. 概述
1.1 版本
运维平台版本 | 功能变更 |
---|---|
V1.7.0 | - |
V2.0.0 | 对于单个告警明细,支持查看对应异常时间的指标状态 |
1.2 功能简介
告警记录是指在告警管理中,针对运维项目出现异常情况时所触发的告警任务的记录。
通过查看告警记录,管理员可以获取关键指标和详细信息,如告警发生时间、告警类型、触发项目等。
管理员可以快速识别常见问题、确定趋势和模式,并采取相应的措施来解决或预防潜在的故障或风险。
2. 功能入口
运维平台支持两种方式查看告警记录,请按需选择:
1)查看运维平台中所有项目的告警记录
管理员登录运维平台,点击「告警中心>告警记录」,即可查看运维平台管理的所有项目的告警记录。
2)查看运维平台中指定项目的告警记录
管理员登录运维平台,选择运维项目,点击「告警中心>告警记录」,即可查看该项目的告警记录。
3. 告警总览
应用场景:
告警总览界面,以折线图,随时间展示各个运维项目的告警次数。
监控趋势:如果某个项目的告警次数持续上升,可能意味着存在潜在的问题或风险需要关注和解决。而告警次数下降可能表示对系统进行了改进或优化。
优先处理:告警次数较多的运维项目可能需要更多关注和优先处理。管理员可以据此合理安排资源和时间,解决最关键和频繁发生的问题。
预防措施:基于告警次数的历史数据,可以发现一些重复发生的问题模式或事件趋势。这些信息可以帮助管理员采取预防措施来防止将来的类似告警事件发生。
效果评估:如果某个项目的告警次数在实施某项改进后减少,可能意味着改进措施有效,反之则需要重新评估或采取新的措施。
操作步骤:
1)选择展示时间:
前24h:以15分钟为时间区间,展示前24h的告警记录次数。
前30d:以天为时间区间,展示前30天的告警记录次数。
2)选择运维项目:
默认全选,可自行点击显示/不显示该运维项目
3)展示告警记录数:
以折线图展示各个时间段、各个运维项目触发的告警记录次数。
点击具体时间点,支持点击「查看告警明细」,可联动下方告警明细。
4. 查看告警明细
应用场景:
告警明细界面,以明细表展示各个告警名称、告警类型、分组、触发项目和触发时间,并支持筛选这些字段。
统计分析:管理员可以根据告警名称和类型进行分类汇总,了解哪些类型或名称的告警事件更为常见或严重,以及它们在各个项目中的分布情况。
问题排查:通过筛选告警名称、类型、触发项目和触发时间等字段,有助于针对特定类型的告警或特定项目的告警进行问题排查。
趋势监控:通过观察触发时间字段,管理员可以了解告警事件发生的时间分布情况。
操作步骤:支持三种查看途径
4.1 自定义筛选告警明细
1)自定义设置筛选条件:
筛选条件 | 说明 |
---|---|
告警名称 | 支持手动输入告警名称 必须与告警任务名称完全一致,不支持模糊搜索 |
告警类型 | 支持选择默认/自定义告警任务 默认全选,不选则显示全部 |
触发项目 | 告警中心支持下拉选择运维项目,默认全选,支持多选 项目-告警不支持选择,仅展示当前项目 |
触发时间 | 支持选择当前时间前7天 默认选择当前时间前1小时 |
2)点击「查询」按钮。
3)展示自定义筛选得出的告警任务明细,包括:告警名称、告警类型、分组、触发项目、触发时间。
4.2 告警总览跳转查看指定时间明细
1)进入界面:
管理员登录FineOps运维平台,点击「监控与告警>告警管理>告警记录>告警总览」。
2)选择时间点:
点击明显异常/告警频发的时间点,出现「查看告警明细」按钮,点击该按钮。
3)查看告警明细:
告警明细中,自动代入所选时间点,展示该时间点下的告警明细。
4.3 告警任务跳转查看指定告警明细
选择一个你关注的告警任务,点击「查看告警记录」按钮,自动调整到告警记录中。
告警明细中,自动代入该告警名称,展示该告警的明细记录。
5. 查看告警时的指标状态
对于每一条告警记录,支持点击「查看详情」,可跳转查看对应异常时间的指标状态。