1. 概述
1.1 版本
維運平台版本 | 功能變更 |
---|---|
V1.5.5 | - |
V1.5.7 | elasticsearch、skywalking_oap組件預設啟動 |
V1.7.0 | 組件啓停重啟時,新增二次確認提示框,以防誤操作 |
V2.0.0 | 交互優化,功能入口位置調整 |
V2.1.0 | 更改配置邏輯優化,對記憶體CPU限制值進行校驗 |
1.2 應用場景
維運平台存在多個組件,需要給管理者提供一個匯總頁面維護所有容器。
組件不可用時,需要給管理者提供快速恢復的方法和手段。
1.3 功能簡介
維運平台提供「維運組件」功能。
管理者登入維運平台,點選「維運平台管理>維運組件」,支援對維運平台中的維運組件進行管理。
2. 展示資訊
維運組件頁面,展示維運平台中的所有維運組件資訊。如下圖所示:
支援展示的維運組件類型包括:
注:基礎版維運平台,不存在鏈路追蹤相關組件,即elasticSearch、skywalking_oap
類型 | 組件 | 組件說明 |
---|---|---|
維運平台相關 | ops | 維運平台容器,對FineReport、FineBI等項目進行維運 |
nginx | 提供負載轉發服務,所有服務的入口、使用都從這個入口存取 | |
ops-agent | 1)綁定物理節點綁定,用於管理、升級維運平台的組件 2)資訊收集,用於收集ops所在伺服器的指標資訊,用於收集nginx、elasticSearch組件的指標資訊 | |
監控警報 | pushgateway | 臨時儲存ops-agent收集到的指標,並供prometheus獲取 |
prometheus | 透過pushgateway,獲取agent收集的指標資料,並提供給監視儀表板 | |
grafana | 用於展示監視儀表板 | |
alertmanager | 警報容器,用於警報規則的修改、觸發等 | |
鏈路追蹤 | elasticsearch | 採集維運項目中FineReport、FineBI、外接資料庫、業務庫和其他外置組件的請求 |
skywalking_oap | 用於鏈路追蹤的資料上報和分析整理 | |
鏡像倉庫 | registry | 存放docker鏡像的倉庫 |
支援展示的組件各類資訊包括:
資訊 | 說明 |
---|---|
當前版本 | 當前組件安裝的鏡像版本 |
組件數量 | 該類型組件數量 |
可更新版本 | 是否存在可更新版本 如已是最新版本,則顯示:當前已為最新版本 如存在更新版本組件,顯示最新鏡像版本號,介面右上角支援「一鍵更新」 |
組件配置 | 展示該類組件下所有容器在下文3.3節的配置(如未配置,顯示無限制) |
容器名 | 容器名稱,方便識別用途 |
容器狀態 | 容器是否啟動 running:啟動 exited:未啟動 |
鏡像資訊 | 容器所使用的鏡像資訊 |
物理節點 | 容器所在伺服器的IP地址 |
運作時間 | 容器的持續運作時間,ops組件會額外顯示健康狀況 healthy:容器健康運作 unhealthy:容器無法正常運作,可能正在重啟,請耐心等待變為健康 |
配置 | 展示下文3.3節的配置(如未配置,顯示無限制) |
操作 | 包括多種操作:更新、啟動、停止、重啟、更改配置、終端 |
3. 組件操作
3.1 更新組件
1)若存在「可更新版本」,可手動點選「一鍵更新」按鈕,即可對該組件進行更新。詳情請參見:內網升級維運平台
2)線上升級維運平台後,管理者登入維運平台時,維運平台會自動檢查並升級維運組件。詳情請參見:外網升級維運平台
3)若當前已為最新版本,則「一鍵更新」按鈕灰化,無法使用,提示「已為最新版本」。
3.2 組件啓停
支援對組件進行啟動、停止、重啟等操作,快速啓停組件。
注1:部分組件間存在聯動關係,重啟某一個組件,會觸發其他組件的重啟。
注2:組件關停,可能會影響維運功能的使用,具體如下表所示:
類型 | 組件 | 組件說明 |
---|---|---|
維運平台相關 | ops | 必須啟動該組件,如不啟動該組件,維運平台直接當機無法登入 因此維運組件介面不支援啓停ops組件,僅支援重啟 |
nginx | 必須啟動該組件,所有服務的入口、使用都從這個入口存取,如不啟動該組件,無法進入維運平台 因此維運組件介面不支援啓停nginx組件,僅支援重啟 | |
ops-agent | 必須啟動該組件,用於管理組件 因此維運組件介面不支援啓停ops-agent組件,僅支援重啟 | |
監視警報 | pushgateway | 如不啟動該組件,「項目監視」中的儀表板無資料 |
prometheus | 如不啟動該組件,「項目監視」中的儀表板無資料,「警報」和「警報中心」無法使用 | |
grafana | 如不啟動該組件,「項目監視」中的儀表板無法查看 | |
alertmanager | 如不啟動該組件,「警報」和「警報中心」無法使用 | |
鏈路追蹤 | elasticsearch | 如不啟動該組件,「鏈路追蹤」和「項目監視>健康觀測」無法使用 |
skywalking_oap | 如不啟動該組件,「鏈路追蹤」和「項目監視>健康觀測」無法使用 | |
鏡像倉庫 | registry | 若使用者自有倉庫,無需啟動該組件 若使用者無鏡像倉庫,可啟動該組件,作為「鏡像管理」的倉庫 |
3.3 更改配置
支援修改組件佔用的CPU和記憶體上限。
記憶體達到上限時會自動重啟組件,有業務連續性要求的組件請勿限制。
更改通用配置將自動重啟組件,可能影響項目正常運作,請勿在使用期間操作。
注1:請輸入大於零的數字。容器CPU不得大於伺服器CPU。容器記憶體不得大於伺服器記憶體。
注2:下表列出的為組件正常運作的最低配置要求。建議使用者進行配置時,使用最低配置的兩倍,請根據伺服器實際情況自行調整。
類型 | 組件 | CPU使用上限 | 記憶體使用上限 | 記憶體配置xmx |
---|---|---|---|---|
維運平台相關 | ops | 2Core | - | - |
nginx | 1Core | - | - | |
ops-agent | 1Core | - | 1G | |
監視警報 | pushgateway | 0.1Core | 0.1G | 0.1G |
prometheus | 1Core | 1G | - | |
grafana | 1Core | 1G | - | |
alertmanager | 1Core | 1G | - | |
鏈路追蹤 | elasticsearch | 1Core | - | 2G |
skywalking_oap | 1Core | - | 2G | |
鏡像倉庫 | registry | 1Core | - | - |
3.4 進入終端
儘管維運平台已經提供了很多介面化操作,但管理者仍有可能需要使用終端工具連結組件,對組件進行管理。
維運平台提供終端工具,支援快速進入組件終端。如下圖所示:
左側顯示「命令行頁面」,使用者可輸入命令進行查詢/執行,支援一鍵清空命令行頁面。
右側顯示該組件的具體容器資訊。
注1:組件必須在啟動running狀態,方可進入組件終端。否則提示「當前容器狀態下不支援進入終端」。
注2:單個維運平台,最多支援同時連結3個組件終端。超過3個時,開啟提示「最多可連結3個終端,當前已達上限,請關閉其他終端後重試。」
注3:若連結終端後,持續10分鐘無命令操作,自動埠連結,提示「終端連結斷開,請重新連結」。如下圖所示: