1. 概述
部署好 FineBI 後,我們還需配置項目,讓平台完成自動維運。對於關鍵項目要定期手動檢查,平台出現異常項時,即時進行處理,保證平台的健康運作。
2. FineBI系統維運
本節分為兩類操作:
一類是管理者首次需要配置好的、讓維運平台定期自動執行的操作。
一類是管理者需要手動定期為項目進行檢查的一些內容。
2.1 配置自動化規則
本節操作均在維運平台中完成。
建議操作 | 說明 |
---|---|
設定自動備份 | 應用場景: 定期自動對項目進行整體異機備份,防止工程伺服器出現意外,工程檔案出現損毀後有辦法快速恢復 功能簡介: 選擇項目,在「維護>備份管理」中開啟自動備份,設定備份頻率 參考文檔:備份專案 |
設定警報物件 | 應用場景: 維運平台監視到項目出現異常時,可以透過email、webhook、企業微信等方式通知管理者 因此管理者需要先設定好警報物件,方便維運平台知道給誰發訊息 功能簡介: 在「警報中心>警報通知設定」中設定警報物件,支援「email、webhook、企業微信、企業微信機器人、釘釘機器人、飛書機器人」多種方式 參考文檔:警報通知設定 |
設定自動系統巡檢 | 應用場景: 系統巡檢,可以理解為定期為系統做體檢,確定即時發現系統的問題並進行調整。 因此管理者需要設定好體檢的週期,讓維運平台自動定期對系統進行監視巡檢。 功能簡介: 選擇項目,在「健康巡檢>系統巡檢>巡檢設定」中開啟系統自動檢查,設定執行週期 參考文檔:系統巡檢 |
設定當機處理策略 | 應用場景: 系統當機之後: 需要第一時間進行重啟,需要第一時間恢復進程,以免影響業務使用者使用 需要匯出當機日誌,幫助管理者事後查看和分析當機原因和優化方案 功能簡介: 選擇項目,在「當機>當機處理策略」中開啟當機自動處理,設定當機相關配置項 參考文檔:當機處理策略 |
2.2 定期手動檢查
本節操作均在維運平台中完成。
建議操作 | 說明 |
---|---|
檢查組件狀態與更新 | 應用場景: 為滿足客戶的新需求以及完善之前版本某些功能的不足之處,帆軟產品在不斷地更新迭代,管理者需要定期檢查項目組件是否正常運作、是否需要更新 功能簡介: 選擇項目,在「維護>組件管理」中可以檢查 |
檢查各類監視儀表板 | 應用場景: 對於伺服器、工程和工程中的組件,維運平台提供對應監視看板,監視各個指標情況 當指標出現異常時,會標黃/標紅顯示 功能簡介: 選擇項目,在「項目監視」中,可以查看各個監視看板,查看異常指標項 |
檢查健康巡檢異常項 | 應用場景: 維運平台會定期對FR/BI工程進行體檢,管理者要根據體檢報表改善工程配置 功能簡介: 選擇項目,在「健康巡檢>系統巡檢」中,根據修改建議優化工程 |
3. FineBI異常處理
本節操作均在維運平台中完成。
問題 | 解決方案 |
---|---|
應用監視與警報 | 當系統運作出現異常時,會觸發系統的警報規則 當觸發警報後,會透過警報方式通知管理者 管理者根據警報內容,優化問題,提前解決問題 |
當機恢復與分析 | 當系統當機之後 1)維運平台可根據當機處理策略,自動重啟工程,恢復進程 2)維運平台提供此次當機的原因和處理方案,可根據方案優化 3)當機後自動匯出堆疊日誌,維運平台可對日誌進行分析,可根據分析報表優化 |
維運日誌下載 | 出現任何問題,需要分析工程日誌時,可透過維運平台快速下載日誌到本地進行分析 |
配置更新與啓停 | 如果檢查到是FR/BI工程或組件的配置不合理,需要進行調整時: 1)對於FR/BI項目組件,可透過組件管理功能對Nginx/Redis/配置庫進行配置修改 2)對於FR/BI工程,可透過「業務配置更改」功能修改工程配置,確定工程平穩運作 |
4. 更多維運內容
平台維運 | 簡介 |
---|---|
瞭解維運平台 | 維運平台是保障帆軟應用穩定運作和全方位維運管理的工具 透過自動化、集中化和視覺化等方式,提高系統穩定性和可用性,降低項目管理成本,加快故障排除和問題解決速度,為企業提供了一套完整的維運解決方案 |
項目運作監視 | 對於接入的維運項目,FineOps維運平台為管理者提供多角度監視和各類維運操作 對於每個項目,維運平台提煉出使用者最關心的資訊和最常用的操作,組合成了「項目總覽」介面 |
定期巡檢優化 | 管理者需要對應用進行定期健康巡檢,確定應用所在的環境及應用內配置合理,以保證應用的正常運作 巡檢內容包括埠檢查、網路服務檢查、儲存服務檢查、環境配置檢查以及業務配置檢查等 |
效能鏈路定位 | 維運平台提供健康觀測與鏈路追蹤功能,幫助管理者定位使用者查看、分析儀表板/報表的效能卡慢問題 本文將基於不同的使用場景,講述如何對「FineBI儀表板」的效能問題進行定位 |