1. 概述
部署好 FDL 後,我們還需配置專案,讓平台完成自動維運。
對於關鍵專案要定期手動檢查,平台出現異常項時,即時進行處理,保證工程的健康運作。
2. 維運說明
| 具體說明 | 重點內容 |
|---|---|
| 运维监控指导手册(必讀) | 正式工程必須 配置外接資料庫 外接資料庫資訊配置檔案說明請點選左側文檔查看 |
| FDL 提供「健康巡檢」功能,可對系統進行定期巡檢,確定應用所在的環境及應用內配置合理,以保證應用的正常運作 | |
| FDL 包含的日誌及說明 | |
| FDL 提供內建功能,可監視記憶體、CPU、磁碟空間是否存在異常 | |
如需對帆軟應用的異常即時感知,需實現對帆軟應用各項指標的監視警報 建議在備份還原,健康巡檢,,磁碟維運,負載管理,當機處理,重要的資料開發任務等地方開啟自帶的提醒設定,並設定除了「平台訊息」之外的有效觸達渠道, 即時發現問題即時處理 | |
| 當機時的維運操作 | |
| 工程定期備份,以確定在使用者誤操作、版本回退等場景下能夠即時恢複 | |
| 工程更新升級 | |
| 产品安全加固指导手册(必讀) | 工程升級 |
增加密碼破解的難度 注:避免使用預設密碼或弱通行碼;建議定期取代密碼;不建議將自己的帳號和密碼分享給其他人 | |
| 開啟登入鎖定,避免暴力破解 | |
| 升級插件,建議全部更新至最新版本 | |
| 開啟配置庫安全選項 |
3. 注意事項(必讀)
部署工程建議
1)正式工程必須 配置外接資料庫
2)如果資源允許,建議部署測試環境和生産環境。一切涉及到工程整體穩定性的敏感操作,比如升級 JAR,修改非常用設定, 測試新插件新功能等, 建議提前在測試環境驗證運作無異常,再上到生産環境。
另外建議定期同步生産環境的配置/任務到測試環境,讓測試環境盡可能貼合生産環境的實際場景,尤其是在升級 JAR 等重大操作節點之前。
使用工程建議
1)操作生産環境的時候,應當盡量在不影響業務使用的時間段。
2)建議維護一份公司內關鍵看板/任務的列表, 在升級操作或其他重大操作完成後, 逐個確認列表項是否正常。
3)建議使用 權限概述 功能。
應當僅系統管理者掌握 FDL 的超管帳號。
其他管理需求,建議透過開啟分級授權,將必要的管理權限下放給其他次級管理者。
使用者權限設定,應當盡可能透過部門角色按照崗責體系設定權限,盡量避免直接給使用者分配權限導緻權限混亂。
注:對於同一權限實體,使用者權限優先大於部門/角色的權限。如果有使用者權限,則直接以使用者權限為準。
工程安全建議
1)為避免伺服器被惡意攻擊,導緻伺服器無法恢複或敏感資料洩:
伺服器後台的 root 密碼應當妥善保管, 定期取代;盡量避免使用密碼認證,推薦使用公私密金鑰進行認證。
重要的業務系統,伺服器後台應當留有審核記錄,或者推薦使用堡壘機系統進行連結,在堡壘機上進行連結權限管理和操作留存。
如果條件允許,建議對作業系統做伺服器層面的整體鏡像備份,避免被惡意攻擊後無法從系統內進行恢複。
2)可能會導緻工程中檔案發生變動的高危操作, 建議對工程整體進行備份,方便出現問題的時候快速整體回滾。
備份時可以排除 Tomcat 日誌,備份目錄,logdb 目錄, bi 抽取資料,FDL 的運作日誌等低價值大目錄,減少備份體積,提高備份速度。具體目錄介紹參考:伺服器管理者備份工程
3)將平台自帶的自動備份頻率調高,建議生産環境一日一備份,並保留更多的備份數量。詳情請參見:備份還原
另外,本地備份也不夠安全,建議配合伺服器磁碟備份,或者使用備份腳本將備份檔案備份到遠端環境,防止諸如勒索病毒或伺服器當機或刪庫跑路等伺服器層面故障。
4)如非必要,盡可能不要直接修改 FineDB 中的配置項,可能多一個空格就有可能導緻配置無法讀取,工程無法啟動。
如果帆軟官方說明必須要修改,建議操作之前千萬做好資料庫和修改表的再次備份, 如果修改後發現異常, 方便回滾設定。
其他
隨着 FDL 的深入使用,工程的效能和可用性要求都會增高,普通的人工維運的方式可能無法即時發現效能問題的早期徵兆, 也難以準確把握系統的負載情況,出現問題後缺乏有效的排查定位的材料和手段。
建議搭配專門的監視警報框架與維運管理工具,如果業務方對 FDL 的可用性要求高,並且伺服器資源充足的話,建議部署我們的 功能簡介
如果後期系統負載很高,單節點壓力大的話,建議部署叢集提高系統的承載能力,同時多節點可以保證單個節點故障時其他節點繼續提供服務。詳情請參見:叢集與單機
