1. 概述
1.1 版本
維運平台版本 | 功能變更 |
---|---|
V1.5.5 | - |
V2.0.0 | 交互優化,功能入口位置調整 |
1.2 功能簡介
管理者需要對應用進行定期健康巡檢,確定應用所在的環境及應用內配置合理,以保證應用的正常運作。
巡檢內容包括埠檢查、網路服務檢查、儲存服務檢查、環境配置檢查以及業務配置檢查等。
檢查專案 | 原因 |
---|---|
系統檢查 | 包括:CPU主頻、核心數、記憶體大小、已使用記憶體、閒置記憶體、交換分割槽、檢查時間、根目錄磁碟、根目錄磁碟剩餘 |
系統運作狀態 | 包括:工程啟動路徑、工程下資料夾大小異常情況、xms配置、插件資訊、註冊資訊、web.xml檢查、容器版本、工程JAR包資訊、伺服器時間 |
埠檢查 | 帆軟應用正常使用程式中,需要伺服器開放一些埠,因此需要對這些埠進行檢查是否開放,避免出現系統功能異常 |
網路檢查 | 檢查應用各組件通訊是否能夠ping通,是否存在丟包情況 |
服務連結性檢查 | 檢查服務是否連通 |
業務檢查 | 包括:finedb、日誌級別、日誌清理、自動備份磁碟佔用限制、自動備份保留數量限制、排程管理任務清理配置 |
環境檢查 | 包括:overcommit_memory、overcommit_ratio、codecache配置、語言配置-Duser.country、語言配置-Duser.language、zip相關配置-Dsun.zip.disableMemoryMapping、gblic記憶體公佈相關配置 |
磁碟檢查 | 1)關注磁碟的效能和使用情況,防止影響業務的正常運作 2)關注磁碟剩餘空間,防止出現磁碟空間不足導致系統運作受影響 |
虛擬機檢查 | 系統當前記憶體、headless模式 |
非容器化部署檢查 | 包括:進程使用者、伺服器主要資料夾權限 |
配置檢查 | 包括:外接資料庫編碼、Nginx健康檢查、Nginx參數配置、叢集參數配置、更新資源無限制時間段配置、二級快取開啟情況、SQL執行時長限制、單範本儲存格數限制、匯入excel儲存格數限制、單資料集列數限制、負載預警開啟、髒資料檢查 |
2. 使用前提
使用「健康巡檢」功能前,必須確定需要被診斷的「目標專案」狀態可用,否則提示「專案狀態異常,請恢復專案後使用或查看其他專案」。
3. 診斷異常項
健康巡檢支援手動檢查和自動定期檢查。
3.1 手動檢查
管理者登入維運平台,選擇需要進行健康診斷的專案。
點選「健康巡檢>系統巡檢」,點選「開始巡檢」按鈕,即可開始診斷。如下圖所示:
維運平台會對應用進行埠檢查、網路服務檢查、儲存服務檢查、環境配置檢查以及業務配置檢查。如果存在異常將顯示在頁面上。
進行修復/更改後,管理者可再次點選「重新診斷」按鈕,「維運平台」會重新對目標應用進行診斷,匯出最新結果。
注1:檢查項具體內容請參考:健康巡檢內容 。
注2:非維運平台部署的單機專案,節點ip有可能顯示為127.0.0.1
3.2 自動檢查
健康診斷支援自動觸發檢查。
管理者登入維運平台,選擇需要自動進行健康診斷的專案。點選「健康巡檢>系統巡檢」,點選「巡檢設定」按鈕。
支援開啟「系統自動檢查」。預設為每週日上午11點進行檢查,使用者也可自行配置自動檢查的時間。如下圖所示:
檢查內容和檢查結果顯示,與手動檢查完全一致。
4. 修復異常項
4.1 快速修復
部分異常配置支援快速修復。
管理者點選「快速修復」按鈕,勾選需要配置的檢查項,點選「應用配置」,即可一鍵配置異常項的值。
配置成功後,跳出提示「應用配置成功,重啟伺服器後生效」。應用工程重啟後,可以發現剛剛的異常項均已成功配置。
注1:若沒有檔案讀寫權限或者無法修改配置檔案時,提示「應用配置失敗:沒有配置檔案讀寫權限」,點選「確定」,則修改失敗。
注2:部分記憶體相關配置項間存在聯動關係,無法僅部分修改,因此「異常項」按鈕灰化,預設勾選修改。
注3:若沒有可快速修復的配置項,則「快速修復」按鈕灰化,不可點選。
4.2 手動修復
檢查項具體設定建議請參考:健康巡檢內容
5. 巡檢報表
對於健康診斷的結果,生成巡檢報表,支援下載/預覽/批量下載。
巡檢報表中預設僅展示存在問題的檢查項,支援切換查看不同節點的全部檢查項。如下圖所示: