管理維運組件

  • 最後修改時間:2025-06-09
  • 1. 概述

    1.1 版本

    維運平台版本功能變更
    V1.5.5
    -
    V1.5.7elasticsearch、skywalking_oap組件預設啟動
    V1.7.0組件啟停重啟時,新增二次確認提示框,以防誤操作
    V2.0.0

    交互優化,功能入口位置調整

    V2.1.0更改配置邏輯優化,對記憶體CPU限制值進行校驗
    V2.18.0新增「開發者模式」
    V2.19.0

    1)優化了維運平台組件的記憶體和 CPU 的預設配置上限
    2)新增對維運平台組件不合理配置的風險提示

    1.2 應用場景

    維運平台中的各個組件(如OPS、Prometheus等)需要持續運作並保持最新版本,以確定系統穩定性和安全性。

    當組件出現異常、資源配置不足或需要升級時,管理者可透過維運組件管理功能快速干預,保障業務連續性。

    1.3 功能簡介

    管理者登入維運平台,點選「維運平台管理>維運組件」,支援對維運平台中的維運組件進行管理。

    1)組件狀態一覽

    • 查看各組件運作狀態、基礎配置

    • 查看鏡像版本、識別待升級組件

    2)維運干預

    • 快速恢復:一鍵重啟異常組件,減少人工排查時間

    • 資源調整:修改 CPU / 記憶體限制,應對突發負載

    • 版本更新:支援一鍵升級組件,避免手動取代帶來的風險

    2. 組件資訊一覽

    維運組件頁面,展示維運平台中的所有維運組件資訊。如下圖所示:

    支援展示的維運組件類型包括:

    注:基礎版維運平台,不存在鏈路追蹤相關組件,即ElasticsearchSkywalking OAP

    類型組件組件說明
    維運平台相關OPS

    維運平台容器,對FineReport、FineBI等專案進行維運

    Nginx提供負載轉發服務,維運平台所有的服務,都從這個入口存取

    OPS Agent

    1)與物理節點綁定,用於管理、升級維運平台的組件

    2)資訊收集,用於收集ops所在伺服器的指標資訊,用於收集nginx、elasticSearch組件的指標資訊

    控警報Pushgateway

    臨時儲存ops-agent收集到的指標,並供prometheus獲取

    Prometheus透過pushgateway,獲取agent收集的指標資料,並提供給監視儀表板
    Grafana

    用於展示監視儀表板

    Alertmanager

    警報容器,用於警報規則的修改、觸發等

    鏈路追蹤Elasticsearch

    採集維運專案中FineReport、FineBI、外接資料庫、業務庫和其他外置組件的請求

    Skywalking OAP

    用於鏈路追蹤的資料上報和分析整理

    鏡像倉庫Registry存放docker鏡像的倉庫

    支援展示的組件各類資訊包括:

    資訊
    說明
    當前版本當前組件對應的鏡像版本
    組件數量該類型組件的容器數量
    可更新版本

    是否存在可更新版本

    如已是最新版本,則顯示:當前已為最新版本

    如存在更新版本組件,顯示最新鏡像版本號,介面右上角支援「一鍵更新」

    組件配置展示該類組件下所有容器在下文3.3節的配置(如未配置,顯示無限制)
    容器名容器名稱,方便識別用途
    容器狀態容器是否啟動

    running:啟動

    exited:未啟動

    鏡像資訊容器所使用的鏡像資訊
    物理節點容器所在伺服器的IP地址
    運作時間

    容器的持續運作時間,ops組件會額外顯示健康狀況

    healthy:容器健康運作

    unhealthy:容器無法正常運作,可能正在重啟,請耐心等待變為健康

    配置展示下文3.3節的配置(如未配置,顯示無限制)
    操作

    包括多種操作:一鍵更新、啟動、停止、重啟、事件、更改配置、終端

    3. 組件操作

    3.1 更新維運組件

    維運平台升級重啟後,管理者登入時將自動檢查並升級維運組件。

    • 若維運組件升級卡住,可手動點選「一鍵更新」按鈕進行更新。

    • 當所有維運組件均為最新版本時,「一鍵更新」按鈕將灰化,並提示「已為最新版本」。

    詳情請參見:內網升級維運平台外網升級維運平台

    3.2 啟停維運組件

    支援對組件進行啟動、停止、重啟等操作,快速啟停組件。

    注1:部分組件間存在聯動關係,重啟某一個組件,會觸發其他組件的重啟。

    注2:維運平台組件啟停,不影響所對接管理的維運專案,不會導致專案跟隨啟停或不可用。

    注3:維運平台組件關停,可能會影響維運平台功能的使用,具體如下表所示:

    類型組件組件說明
    維運平台相關OPS

    必須啟動該組件,如不啟動該組件,維運平台直接當機無法登入

    因此維運組件介面不支援啟停ops組件,僅支援重啟

    Nginx

    必須啟動該組件,所有服務的入口、使用都從這個入口存取,如不啟動該組件,無法進入維運平台

    因此維運組件介面不支援啟停nginx組件,僅支援重啟

    OPS Agent

    必須啟動該組件,用於管理組件

    因此維運組件介面不支援啟停ops_agent組件,僅支援重啟

    監視警報Pushgateway如不啟動該組件,「專案監視」中的儀表板無資料
    Prometheus如不啟動該組件,「專案監視」中的儀表板無資料,「警報」和「警報中心」無法使用
    Grafana

    如不啟動該組件,「專案監視」中的儀表板無法查看

    Alertmanager

    如不啟動該組件,「警報」和「警報中心」無法使用

    鏈路追蹤Elasticsearch

    如不啟動該組件,「鏈路追蹤」和「專案監視>健康觀測」無法使用

    Skywalking OAP

    如不啟動該組件,「鏈路追蹤」和「專案監視>健康觀測」無法使用

    鏡像倉庫
    Registry

    若使用者自有倉庫,無需啟動該組件

    若使用者無鏡像倉庫,可啟動該組件,作為「鏡像管理」的倉庫

    3.3 更改組件配置

    1)點選目標組件對應的「更改配置」,即可進入該組件的更改配置操作介面。

    2)修改配置,點選「確定」即可

    支援修改的配置及其預設值如下表所示:

    組件
    配置項
    說明
    OPSCPU

    配置該組件可佔用的伺服器CPU上限

    預設值:2Core

    限制值:2Core

    注:如CPU上限配置不滿足限制要求,在維運平台首頁會高亮提醒「維運平台組件存在配置不足風險,可能對維運平台功能產生影響,請儘快對以下組件更改配置:OPS」

    記憶體

    配置該組件可佔用的伺服器記憶體上限

    預設值:4G

    限制值:≥(xmx+1.5)G

    注1:記憶體達到上限時會自動重啟組件,有業務連續性要求的組件請勿限制。

    注2:如記憶體上限配置不滿足限制要求,在維運平台首頁會高亮提醒「維運平台組件存在配置不足風險,可能對維運平台功能產生影響,請儘快對以下組件更改配置:OPS」

    xmx

    配置該組件的最大堆記憶體

    預設值:2G

    限制值:≥(1.5+X*0.05+Y*0.1)G

    X:已對接的非維運平台部署的專案節點總數

    Y:已對接的維運平台部署的專案節點總數

    注1:修改維運平台OPS組件的xmx配置,會自動觸發維運平台的重啟,請勿在工作時間操作

    注2:如xmx配置不滿足限制要求,在維運平台首頁會高亮提醒「維運平台組件存在配置不足風險,可能對維運平台功能產生影響,請儘快對以下組件更改配置:OPS」

    注3:如xmx配置不滿足限制要求,導致資源不足以對接新專案,在維運平台首頁會高亮提醒「當前維運平台配置已經達到上限,將影響接入或部署新專案,請儘快調大ops的xmx配置」

    NginxCPU

    配置該組件可佔用的伺服器CPU上限

    預設值:1Core

    限制值:請輸入大於零的數字,強烈建議大於預設值

    記憶體

    配置該組件可佔用的伺服器記憶體上限

    預設值:1G

    限制值:請輸入大於零的數字,強烈建議大於預設值

    注:記憶體達到上限時會自動重啟組件,有業務連續性要求的組件請勿限制

    SSL配置
    為維運平台配置SSL
    client_max_body_size允許使用者最大上傳資料大小,根據業務需求調整上傳檔案大小限制,預設值為100M
    proxy_buffer_size設定緩衝區的大小為size,例如64k
    proxy_buffers每個連結設定緩衝區的數量和大小,proxy_buffers [number] [size],例如32 64k
    proxy_busy_buffers_size當開啟緩衝回應的功能以後,在沒有讀到全部回應的情況下,寫緩衝到達一定大小時,nginx一定會向用戶端傳送回應,直到緩衝小於此值,例如64k
    proxy_connect_timeoutnginx連結到後端伺服器的逾時時間,是建立連結的時間,而不是等待後端傳回回應的時間,例如60s
    proxy_read_timeout

    讀取逾時,預設60s

    如果在逾時時間內伺服器未傳回任何資料,視為逾時

    如果沒有大數據量計算或匯出的範本,則建議配置不超過100s

    如果有大數據量計算或匯出的範本,則根據最長耗時的範本時間進行配置

    proxy_send_timeout

    寫入逾時,預設60s

    如果在逾時時間內伺服器未收到資料表示逾時,視為逾時

    如果沒有大數據量計算或匯出的範本,則建議配置不超過100s

    如果有大數據量計算或匯出的範本,則根據最長耗時的範本時間進行配置

    OPS Agent

    CPU配置該組件可佔用的伺服器CPU上限

    預設值:1Core

    限制值:請輸入大於零的數字,強烈建議大於預設值

    記憶體

    配置該組件可佔用的伺服器記憶體上限

    預設值:1G

    限制值:

    • 請輸入大於零的數字,強烈建議大於預設值

    • 容器記憶體不得大於伺服器記憶體

    • 容器記憶體必須滿足當前記憶體配置,即必須大於等於0.5+xmx

    注:記憶體達到上限時會自動重啟組件,有業務連續性要求的組件請勿限制

    xmx

    配置該組件的最大堆記憶體

    預設值:0.5G

    限制值:

    • 請輸入大於零的數,建議大於預設值

    • 修改這部分值會聯動觸發OPS Agent記憶體數值的校驗

    PushgatewayCPU配置該組件可佔用的伺服器CPU上限

    預設值:2Core

    限制值:≥(0.5*對接的專案數量)Core,最低2Core

    注:如CPU上限配置不滿足限制要求,在維運平台首頁會高亮提醒「維運平台組件存在配置不足風險,可能對維運平台功能產生影響,請儘快對以下組件更改配置:Pushgateway

    記憶體

    配置該組件可佔用的伺服器記憶體上限

    預設值:1G

    限制值:≥(0.2+0.2*對接的專案數量)G,最低0.5G

    注1:記憶體達到上限時會自動重啟組件,有業務連續性要求的組件請勿限制。

    注2:如記憶體配置不滿足限制要求,在維運平台首頁會高亮提醒「維運平台組件存在配置不足風險,可能對維運平台功能產生影響,請儘快對以下組件更改配置:Pushgateway

    PrometheusCPU配置該組件可佔用的伺服器CPU上限

    預設值:1Core

    限制值:請輸入大於零的數字,強烈建議大於預設值

    記憶體

    配置該組件可佔用的伺服器記憶體上限

    預設值:2G

    限制值:

    • 請輸入大於零的數字,強烈建議大於預設值

    • 容器記憶體不得大於伺服器記憶體

    • 預設值可支撐同時查詢7天範圍內的資料,如果需要查詢更長時間資料或多使用者併發查詢場景較多,建議提高記憶體限制

    注:記憶體達到上限時會自動重啟組件,有業務連續性要求的組件請勿限制

    GrafanaCPU配置該組件可佔用的伺服器CPU上限

    預設值:1Core

    限制值:請輸入大於零的數字,強烈建議大於預設值

    記憶體

    配置該組件可佔用的伺服器記憶體上限

    預設值:1G

    限制值:

    • 請輸入大於零的數字,強烈建議大於預設值

    • 容器記憶體不得大於伺服器記憶體

    • 建議關注平台監視中記憶體監視情況,如果併發使用者較多,建議提高記憶體限制

    注:記憶體達到上限時會自動重啟組件,有業務連續性要求的組件請勿限制

    AlertmanagerCPU

    配置該組件可佔用的伺服器CPU上限

    預設值:1Core

    限制值:請輸入大於零的數字,強烈建議大於預設值

    記憶體

    配置該組件可佔用的伺服器記憶體上限

    預設值:0.5G

    限制值:

    • 請輸入大於零的數字,強烈建議大於預設值

    • 容器記憶體不得大於伺服器記憶體

    注:記憶體達到上限時會自動重啟組件,有業務連續性要求的組件請勿限制

    ElasticsearchCPU

    配置該組件可佔用的伺服器CPU上限

    預設值:1Core

    限制值:請輸入大於零的數字,強烈建議大於預設值

    記憶體

    配置該組件可佔用的伺服器記憶體上限

    預設值:4G

    限制值:

    • 請輸入大於零的數字,強烈建議大於預設值

    • 容器記憶體不得大於伺服器記憶體

    • 容器記憶體必須滿足當前記憶體配置,即必須大於等於1.5*xmx

    注:記憶體達到上限時會自動重啟組件,有業務連續性要求的組件請勿限制

    xmx

    配置該組件的最大堆記憶體

    預設值:2G

    限制值:

    • 請輸入大於零的數,建議大於預設值

    • 修改這部分值會聯動觸發Elasticsearch記憶體數值的校驗

    Skywalking OAPCPU

    配置該組件可佔用的伺服器CPU上限

    預設值:1Core

    限制值:請輸入大於零的數字,強烈建議大於預設值

    記憶體

    配置該組件可佔用的伺服器記憶體上限

    預設值:3G

    限制值:

    • 請輸入大於零的數字,強烈建議大於預設值

    • 容器記憶體不得大於伺服器記憶體

    注:記憶體達到上限時會自動重啟組件,有業務連續性要求的組件請勿限制

    RegistryCPU

    配置該組件可佔用的伺服器CPU上限

    預設值:1Core

    限制值:請輸入大於零的數字,強烈建議大於預設值

    記憶體配置該組件可佔用的伺服器記憶體上限

    預設值:1G

    限制值:

    • 請輸入大於零的數字,強烈建議大於預設值

    • 容器記憶體不得大於伺服器記憶體

    注:記憶體達到上限時會自動重啟組件,有業務連續性要求的組件請勿限制


    3.4 進入終端

    儘管維運平台已經提供了很多介面化操作,但管理者仍有可能需要使用終端工具連結組件,對組件進行管理。

    維運平台提供終端工具,支援快速進入組件終端。如下圖所示:

    左側顯示「命令行頁面」,使用者可輸入命令進行查詢/執行,支援一鍵清空命令行頁面。

    右側顯示該組件的具體容器資訊。

    注1:組件必須在啟動running狀態,方可進入組件終端。否則提示「當前容器狀態下不支援進入終端」。

    注2:單個維運平台,最多支援同時連結3個組件終端。超過3個時,開啟提示「最多可連結3個終端,當前已達上限,請關閉其他終端後重試。」

    注3:若連結終端後,持續10分鐘無命令操作,自動埠連結,提示「終端連結斷開,請重新連結」。如下圖所示:

    3.5 修改維運平台埠

    維運平台的存取埠,即維運平台的Nginx組件埠。

    維運平台部署成功後,如需調整維運平台存取埠,可透過本節方案修改

    1)確定埠可用性

    請確定所準備的埠是否已被使用,如已被使用,請安排好其他閒置埠。

    埠占用檢查和防火牆放行方法請參考:埠占用檢查與防火牆配置

    2)進入開發者模式

    • 管理者登入維運平台,點選「維運平台管理>維運組件」。

    • 在組件管理介面下滑到最底部,點選「進入開發者模式>確定」,即可進入開發者模式。

    3)變更埠

    • 找到nginx組件容器,點選「變更埠」。

    • 修改需要調整的主機埠。

    4)自動重啟容器

    點選「確定」,出現提示「確定更改並重啟容器?」

    點選「確定」,維運平台會自動重啟。請耐心等待重啟成功,即可修改成功。

    維運平台會自動調整以下內容:

    • 維運平台的nginx轉發策略會直接跟隨變更

    • 維運平台與專案之間的對接會自動相容處理

    • 自動重啟容器,新埠配置生效

    附件列表


    主題: 維運平台管理
    已經是第一篇
    已經是最後一篇
    • 有幫助
    • 沒幫助
    • 只是瀏覽