當前為10.0版本文檔,更多實例內容將在最新幫助文檔中展現,點選跳轉至 最新版幫助文檔

系統可用性監測工具

1. 概述

1.1 版本

FineReport 版本JAR 包安裝包運行環境
10.02020-04-26系統可用性檢測工具安裝包

Windows 和 Linux 系統

JDK1.8

2020-08-03

1.2 應用場景

系統可用性監測工具能提供監控節點健康狀态并進行日志記錄的功能,但有時用戶在工程全部宕機後需要收到平台的異常通知。

1.3 功能簡介

增加配置郵件服務器,以及基於郵件服務器的通知功能,通過配置郵件服務器實現工程異常狀态通知,并允許定義收件人、通知内容、通知頻率。

2. Linux 環境安裝使用

2.1 安裝檢測工具

java -version  # 依賴Java環境,檢測依賴環境

下載安裝包并将其放到/usr目錄下,解壓并爲其配置可執行權限,命令如下所示:

cd /usr #進入/usr目錄
unzip cluster-check-2.0-SNAPSHOT.zip -d usableTool #解壓安裝包到usableTool文件夾
cd /usr/usableTool #進入目錄
chmod +x  *.jar *.sh #給cluster-check-2.0-SNAPSHOT、start.sh、 stop.sh、 reload.sh賦予可執行權限

2.2 修改配置

conf.properties中配置監測選項,注意該配置文件需要放在 JAR 文件的同級目錄下。

2.2.1 基礎配置

可配置項如下所示:

配置項參數名(包括默認配置值)可配置值說明
要監控的工程地址

urls


要監控的工程地址,需要配置集群入口和各節點入口,例如(http://crm.finereporthelp.com)或者ip+端口,以空格分隔
默認使用健康監測地址

defaultUri


默認使用 /webroot/decision/system/info 作爲健康監測的地址,2019.08後的jar包可以用 /webroot/decision/system/health 作爲健康監測的地址,允許自定義健康監測地址
請求超時時間timeout

請求間隔period

失敗次數failedTime
失敗x次才認爲系統不可用

日志等級

logLevel
日志等級【info|warn|debug】,默認爲 debug,會返回錯誤代碼,即系統沒有挂掉但是狀态碼不是健康狀态碼#若設置爲info,會記錄所有請求#若設置爲warn,則只記錄失敗的請求
日志時間格式dateFormat
默認爲dateFormat=yyyy-MM-dd HH:mm:ss
健康狀态碼expectAliveCode
健康狀态碼,支持正則,以空格分隔
是否開機自啓動startOnUp
是否開機自啓動,需要root用戶權限,默認爲true

2.2.2 配置郵件服務器

允許用戶配置以下内容:

配置項參數名可配置值
說明
郵件服務器smtpSMTP.gmail.com
SMTP.sina.com
SMTP.163.com
SMTP.qq.com
SMTP.sohu.com
SMTP.live.com
SMTP.mail.yahoo.com
SMTP.netease.com
SMTP.sina.com.cn
SMTP.263.net
SMTP.126.com
允許配置列表中的郵件服務器
smtp 端口smtp_port數值默認 25
加密方式smtp_encryptionSSL\TLS\nothing默認 nothing
發件人地址sender_address
填寫郵箱地址
收件人地址recipient_address
多個收件人以英文逗号隔開
密碼password

郵件密碼,加密顯示

注:在首次啓動時提示用戶輸入郵箱密碼,配置完成後發送一個測試郵件,若用戶需要重新配置則在配置文件裏删除此字段,再次啓動時即可提示需要配置郵箱密碼。

允許用戶配置通知頻率。當檢測到異常即進行通知,若應用持續異常,則下一次通知爲1h後,直到檢測到工程恢複正常則停止通知。

2.2.3 配置多個健康檢查地址

爲了能夠更精準地識别異常情況,允許用戶配置多個健康檢查接口,共用配置的 IP 和端口。

2.2.4 自定義通知内容

默認通知内容:#url# #healthurl# access failed, please check its health status

允許用戶對通知内容進行自定義。

2.2.5 提高健康檢測頻率

當做了異常通知時,就要考慮到消息通知的及時性,因爲 5s 檢測一次時間就比較長了,如果超時就需要500s才會發通知。

調整健康檢測相關的默認參數:

timeout=10000
period=5000
failedTime=3

2.2.6 引用平台消息通知模塊

考慮到工具的穩定性和可維護性,直接引用平台消息通知模塊實現。

2.3 運行監測工具

./start.sh  # 開始          
./stop.sh  # 結束
./reload.sh   #修改配置文件後,reload即可生效
ps -ef|grep cluster-check   # 查看進程 

1570541311576650.png

3. Windows 環境

3.1 安裝檢測工具

下載安裝包并利用解壓工具解壓, 在conf.properties中配置監測選項

注意:Windows環境的安裝包同 Linux 一緻,并且配置項的修改内容也一緻。

3.2 運行監測工具

點擊start.bat開始,點擊stop.bat結束,修改配置文件後,點擊reload.bat生效。

查看進程:

1569225109244417.png

4. 監測報告示例

/usableTool/logs路徑下的 system.log 中查看,示例如下圖所示:

企業微信截圖_15675686794711.png


附件列表


主題: 原簡體文檔
  • 有幫助
  • 沒幫助
  • 只是瀏覽

文 檔回 饋

滑鼠選中內容,快速回饋問題

滑鼠選中存在疑惑的內容,即可快速回饋問題,我們將會跟進處理。

不再提示

10s後關閉

反饋已提交

網絡繁忙