系统可用性监测工具能提供监控节点健康状态并进行日志记录的功能,但有时用户在工程全部宕机后需要收到平台的异常通知。
增加配置邮件服务器,以及基于邮件服务器的通知功能,通过配置邮件服务器实现工程异常状态通知,并允许定义收件人、通知内容、通知频率。
工具的运行环境:JDK 1.8 且小版本需在 JDK8u102 以上
java -version # 依赖Java环境,检测依赖环境
下载安装包:系统可用性检测工具安装包,并将其放到/usr目录下,解压并为其配置可执行权限,命令如下所示:
cd /usr #进入/usr目录unzip cluster-check-2.0-SNAPSHOT.zip -d usableTool #解压安装包到usableTool文件夹cd /usr/usableTool #进入目录chmod +x *.jar *.sh #给cluster-check-2.0-SNAPSHOT、start.sh、 stop.sh、 reload.sh赋予可执行权限
在conf.properties中配置监测选项,注意该配置文件需要放在 JAR 文件的同级目录下。
可配置项如下所示:
urls
defaultUri
日志等级
允许用户配置以下内容:
邮件密码,加密显示
注:在首次启动时提示用户输入邮箱密码,配置完成后发送一个测试邮件,若用户需要重新配置则在配置文件里删除此字段,再次启动时即可提示需要配置邮箱密码。
允许用户配置通知频率。当检测到异常即进行通知,若应用持续异常,则下一次通知为 1h 后,直到检测到工程恢复正常则停止通知。
为了能够更精准地识别异常情况,允许用户配置多个健康检查接口,共用配置的 IP 和端口。
默认通知内容:#url# #healthurl# access failed, please check its health status。
允许用户对通知内容进行自定义。
当做了异常通知时,就要考虑到消息通知的及时性,因为 5s 检测一次时间就比较长了,如果超时就需要 500s 才会发通知。
调整健康检测相关的默认参数:
timeout=10000period=5000failedTime=3
考虑到工具的稳定性和可维护性,直接引用平台消息通知模块实现。
./start.sh # 开始 ./stop.sh # 结束./reload.sh #修改配置文件后,reload即可生效ps -ef|grep cluster-check # 查看进程
下载安装包并利用解压工具解压, 在conf.properties中配置监测选项
注意:Windows环境的安装包同 Linux 一致,并且配置项的修改内容也一致。
点击start.bat开始,点击stop.bat结束,修改配置文件后,点击reload.bat生效。
查看进程:
在/usableTool/logs路径下的 system.log 中查看,示例如下图所示:
滑鼠選中內容,快速回饋問題
滑鼠選中存在疑惑的內容,即可快速回饋問題,我們將會跟進處理。
不再提示
10s後關閉
反馈已提交
网络繁忙