交互優化,功能入口位置調整
1)優化了維運平台組件的記憶體和 CPU 的預設配置上限2)新增對維運平台組件不合理配置的風險提示
維運平台中的各個組件(如OPS、Prometheus等)需要持續運作並保持最新版本,以確定系統穩定性和安全性。
當組件出現異常、資源配置不足或需要升級時,管理者可透過維運組件管理功能快速干預,保障業務連續性。
管理者登入維運平台,點選「維運平台管理>維運組件」,支援對維運平台中的維運組件進行管理。
1)組件狀態一覽
查看各組件運作狀態、基礎配置
查看鏡像版本、識別待升級組件
2)維運干預
快速恢復:一鍵重啟異常組件,減少人工排查時間
資源調整:修改 CPU / 記憶體限制,應對突發負載
版本更新:支援一鍵升級組件,避免手動取代帶來的風險
維運組件頁面,展示維運平台中的所有維運組件資訊。如下圖所示:
支援展示的維運組件類型包括:
注:基礎版維運平台,不存在鏈路追蹤相關組件,即Elasticsearch、Skywalking OAP
維運平台容器,對FineReport、FineBI等專案進行維運
OPS Agent
1)與物理節點綁定,用於管理、升級維運平台的組件
2)資訊收集,用於收集ops所在伺服器的指標資訊,用於收集nginx、elasticSearch組件的指標資訊
臨時儲存ops-agent收集到的指標,並供prometheus獲取
用於展示監視儀表板
警報容器,用於警報規則的修改、觸發等
採集維運專案中FineReport、FineBI、外接資料庫、業務庫和其他外置組件的請求
用於鏈路追蹤的資料上報和分析整理
支援展示的組件各類資訊包括:
是否存在可更新版本
如已是最新版本,則顯示:當前已為最新版本
如存在更新版本組件,顯示最新鏡像版本號,介面右上角支援「一鍵更新」
running:啟動
exited:未啟動
容器的持續運作時間,ops組件會額外顯示健康狀況
healthy:容器健康運作
unhealthy:容器無法正常運作,可能正在重啟,請耐心等待變為健康
包括多種操作:一鍵更新、啟動、停止、重啟、事件、更改配置、終端
維運平台升級重啟後,管理者登入時將自動檢查並升級維運組件。
若維運組件升級卡住,可手動點選「一鍵更新」按鈕進行更新。
當所有維運組件均為最新版本時,「一鍵更新」按鈕將灰化,並提示「已為最新版本」。
詳情請參見:內網升級維運平台、外網升級維運平台
支援對組件進行啟動、停止、重啟等操作,快速啟停組件。
注1:部分組件間存在聯動關係,重啟某一個組件,會觸發其他組件的重啟。
注2:維運平台組件啟停,不影響所對接管理的維運專案,不會導致專案跟隨啟停或不可用。
注3:維運平台組件關停,可能會影響維運平台功能的使用,具體如下表所示:
必須啟動該組件,如不啟動該組件,維運平台直接當機無法登入
因此維運組件介面不支援啟停ops組件,僅支援重啟
必須啟動該組件,所有服務的入口、使用都從這個入口存取,如不啟動該組件,無法進入維運平台
因此維運組件介面不支援啟停nginx組件,僅支援重啟
必須啟動該組件,用於管理組件
因此維運組件介面不支援啟停ops_agent組件,僅支援重啟
如不啟動該組件,「專案監視」中的儀表板無法查看
如不啟動該組件,「警報」和「警報中心」無法使用
如不啟動該組件,「鏈路追蹤」和「專案監視>健康觀測」無法使用
若使用者自有倉庫,無需啟動該組件
若使用者無鏡像倉庫,可啟動該組件,作為「鏡像管理」的倉庫
1)點選目標組件對應的「更改配置」,即可進入該組件的更改配置操作介面。
2)修改配置,點選「確定」即可。
支援修改的配置及其預設值如下表所示:
配置該組件可佔用的伺服器CPU上限
預設值:2Core
限制值:≥2Core
注:如CPU上限配置不滿足限制要求,在維運平台首頁會高亮提醒「維運平台組件存在配置不足風險,可能對維運平台功能產生影響,請儘快對以下組件更改配置:OPS」
配置該組件可佔用的伺服器記憶體上限
預設值:4G
限制值:≥(xmx+1.5)G
注1:記憶體達到上限時會自動重啟組件,有業務連續性要求的組件請勿限制。
注2:如記憶體上限配置不滿足限制要求,在維運平台首頁會高亮提醒「維運平台組件存在配置不足風險,可能對維運平台功能產生影響,請儘快對以下組件更改配置:OPS」
配置該組件的最大堆記憶體
預設值:2G
限制值:≥(1.5+X*0.05+Y*0.1)G
X:已對接的非維運平台部署的專案節點總數
Y:已對接的維運平台部署的專案節點總數
注1:修改維運平台OPS組件的xmx配置,會自動觸發維運平台的重啟,請勿在工作時間操作
注2:如xmx配置不滿足限制要求,在維運平台首頁會高亮提醒「維運平台組件存在配置不足風險,可能對維運平台功能產生影響,請儘快對以下組件更改配置:OPS」
注3:如xmx配置不滿足限制要求,導致資源不足以對接新專案,在維運平台首頁會高亮提醒「當前維運平台配置已經達到上限,將影響接入或部署新專案,請儘快調大ops的xmx配置」
預設值:1Core
限制值:請輸入大於零的數字,強烈建議大於預設值
預設值:1G
注:記憶體達到上限時會自動重啟組件,有業務連續性要求的組件請勿限制
讀取逾時,預設60s
如果在逾時時間內伺服器未傳回任何資料,視為逾時
如果沒有大數據量計算或匯出的範本,則建議配置不超過100s
如果有大數據量計算或匯出的範本,則根據最長耗時的範本時間進行配置
寫入逾時,預設60s
如果在逾時時間內伺服器未收到資料表示逾時,視為逾時
限制值:
請輸入大於零的數字,強烈建議大於預設值
容器記憶體不得大於伺服器記憶體
容器記憶體必須滿足當前記憶體配置,即必須大於等於0.5+xmx
預設值:0.5G
請輸入大於零的數字,建議大於預設值
修改這部分值會聯動觸發OPS Agent記憶體數值的校驗
限制值:≥(0.5*對接的專案數量)Core,最低2Core
注:如CPU上限配置不滿足限制要求,在維運平台首頁會高亮提醒「維運平台組件存在配置不足風險,可能對維運平台功能產生影響,請儘快對以下組件更改配置:Pushgateway」
限制值:≥(0.2+0.2*對接的專案數量)G,最低0.5G
注2:如記憶體配置不滿足限制要求,在維運平台首頁會高亮提醒「維運平台組件存在配置不足風險,可能對維運平台功能產生影響,請儘快對以下組件更改配置:Pushgateway」
預設值可支撐同時查詢7天範圍內的資料,如果需要查詢更長時間資料或多使用者併發查詢場景較多,建議提高記憶體限制
建議關注平台監視中記憶體監視情況,如果併發使用者較多,建議提高記憶體限制
容器記憶體必須滿足當前記憶體配置,即必須大於等於1.5*xmx
修改這部分值會聯動觸發Elasticsearch記憶體數值的校驗
預設值:3G
儘管維運平台已經提供了很多介面化操作,但管理者仍有可能需要使用終端工具連結組件,對組件進行管理。
維運平台提供終端工具,支援快速進入組件終端。如下圖所示:
左側顯示「命令行頁面」,使用者可輸入命令進行查詢/執行,支援一鍵清空命令行頁面。
右側顯示該組件的具體容器資訊。
注1:組件必須在啟動running狀態,方可進入組件終端。否則提示「當前容器狀態下不支援進入終端」。
注2:單個維運平台,最多支援同時連結3個組件終端。超過3個時,開啟提示「最多可連結3個終端,當前已達上限,請關閉其他終端後重試。」
注3:若連結終端後,持續10分鐘無命令操作,自動埠連結,提示「終端連結斷開,請重新連結」。如下圖所示:
維運平台的存取埠,即維運平台的Nginx組件埠。
維運平台部署成功後,如需調整維運平台存取埠,可透過本節方案修改
1)確定埠可用性
請確定所準備的埠是否已被使用,如已被使用,請安排好其他閒置埠。
埠占用檢查和防火牆放行方法請參考:埠占用檢查與防火牆配置
2)進入開發者模式
管理者登入維運平台,點選「維運平台管理>維運組件」。
在組件管理介面下滑到最底部,點選「進入開發者模式>確定」,即可進入開發者模式。
3)變更埠
找到nginx組件容器,點選「變更埠」。
修改需要調整的主機埠。
4)自動重啟容器
點選「確定」,出現提示「確定更改並重啟容器?」
點選「確定」,維運平台會自動重啟。請耐心等待重啟成功,即可修改成功。
維運平台會自動調整以下內容:
維運平台的nginx轉發策略會直接跟隨變更
維運平台與專案之間的對接會自動相容處理
自動重啟容器,新埠配置生效