1. 概述
1.1 版本
运维平台版本 | 功能变更 |
---|---|
V1.0 | - |
V1.2 | 1)「告警方式」新增支持「企业微信」 2)新增「告警规则」功能,支持自定义告警规则 |
1.2 应用场景
当应用出现高负载、宕机风险、磁盘空间不足等情况时,需要及时通知管理员
1)运维平台内置了一些告警规则,也支持用户自定义告警规则
2)当触发告警时,支持通过三种方式通知管理员:邮箱、webhook和企业微信。
2. 告警方式
当触发告警时,支持通过三种方式通知管理员:邮箱、webhook和企业微信。
2.1 邮箱告警
如需使用邮箱告警,需配置发件人和收件人。
2.1.1 配置发件人
发邮件,需要有一个发件人,否则发送动作无法完成。
管理员登录「运维平台」,点击「告警配置>告警规则」。点击「添加发件人」,配置发件人账户,点击「确定」,设置「系统默认发件人」,点击「保存」。如下图所示:
注1:发件人邮箱类型不同,配置步骤可能不完全相同,具体请参见:邮箱。
注2:配置完成后,请点击「发送测试邮件」,确保邮箱可使用。
2.1.2 配置告警收件人
发邮件,需要配置收件人,接受告警信息。
管理员登录「运维平台」,点击「告警配置>告警规则」。
点击「添加告警对象」,设置告警类型为「email」,设置告警对象名称和收件人地址,点击「确定」,点击「保存」。如下图所示:
2.2 webhook告警
管理员可以提供一个Webhook 的url,当有新数据的告警消息时,运维平台会往这个 url 发数据,提醒用户告警。
管理员登录「运维平台」,点击「告警配置>告警规则」。
点击「添加告警对象」,设置告警类型为「webhook」,设置告警对象名称和 Webhook 的相关接口信息,点击「确定」,点击「保存」。如下图所示:
注:若 Webhook 的接口存在验证,需要配置用户名及密码。
2.3 企业微信告警
V2.0及之后版本的运维平台,支持通过企业微信发送告警通知。
管理员需要先在企业微信端创建一个用于发送告警的应用,并获得相关应用参数,方可进入运维平台配置告警对象。
2.3.1 微信后台创建应用
企业微信管理员登录 企业微信管理后台,在「应用管理」Tab 下点击「创建应用」,如下图所示:
上传应用 logo,填写应用名称,应用介绍选填,设置可见范围,设置完成后,点击「创建应用」,如下图所示:
建议将可见范围设置为部门/标签。若「可见范围」是单独的微信用户,那么在平台「微信管理」的「成员管理」Tab下会看不到用户信息。
2.3.2 获取微信参数
管理员需要在企业微信后台获取以下参数数据。
参数名 | 含义 |
---|---|
CorpID | 企业ID |
应用AgentID | 用于发送告警的应用的AgentID |
应用Secret | 用于发送告警的应用的Secret |
接收对象 | 用于接收告警的部门或用户ID,请确保该部门/用户在上文设置的应用可见范围内 |
1)CorpID
企业微信管理员登录 企业微信管理后台,在「我的企业」Tab 下,点击「企业信息」,即可获取CorpID。如下图所示:
2)应用AgentID和应用Secret
企业微信管理员登录 企业微信管理后台,在「应用管理」Tab 下,点击刚刚新建的用于发送告警信息的应用,即可获取应用AgentID和应用Secret。如下图所示:
3)接收对象的部门或用户ID
企业微信管理员登录 企业微信管理后台,在「通讯录」Tab 下。
左侧可选择部门,点击后方的按钮,即可查看部门ID
点击单个用户的信息,即可在信息详情页查看用户ID
请确保该部门/用户在上文设置的应用可见范围内。
2.3.3 配置告警对象
管理员登录「运维平台」,点击「告警配置>告警规则」。
点击「添加告警对象」,设置告警类型为「企业微信」,填写2.3.2节获取的相关微信参数信息,点击「确定」,点击「保存」。如下图所示:
注1:接收对象仅支持设置单个用户/单个部门。请确保该部门/用户在上文设置的发送告警信息的应用可见范围内。
注2:若部门ID/用户ID为空,则告警信息将推送给应用可见范围内的全部用户。
3. 告警规则
3.1 内置规则
V1.0版本的运维平台不支持用户自定义告警规则,运维平台内置了三个规则,触发告警规则后会根据配置的告警方式提醒对应责任人。
1)规则1:应用高负载告警
判断逻辑:应用负载分高于100/120或连续两次获取指标失败时进行告警
2)规则2:应用宕机告警
判断逻辑:应用连续三次负载分高于100/120或连续2分钟获取指标失败时进行告警
3)规则3:磁盘空间不足告警
判断逻辑:各目录磁盘剩余空间不足10G且总磁盘空间能够正常获取时进行告警
3.2 自定义规则
V2.0及之后版本的运维平台支持用户自定义增删改告警规则。如下图所示: