系統健康觀測

  • 最後修改時間:2025-02-25
  • 1. 概述

    1.1 版本

    維運平台版本
    功能變更
    V1.5.5-
    V1.5.6

    系統健康觀測介面展示優化

    1)請求併發量和線上使用者數,優化為併發峯值和併發使用者峯值

    2)各指標圖支援互相「定位當前時間」

    3)各指標圖支援拖動調整時間區間

    4)各指標圖支援放大查看

    V1.5.8新增「佔用高記憶體的資源」清單
    V1.5.9

    1)新增「健康巡檢」強提醒按鈕

    2)各指標圖和明細表標題聯動顯示時間點,快速定位時間

    V1.10.0

    1)新增模組切換、請求類型篩選等全局元件

    2)「節點情況明細表」更名為「節點概況表」

    V1.12.0為確定精確定位鏈路資訊,系統健康觀測聯動跳轉鏈路詳情時,部分跳轉項從「首屏鏈路」調整為「呼叫鏈路
    V2.3.0優化效能指數APDEX計算邏輯,提高效能標準,為使用者提供更好的效能體驗

    1.2 功能簡介

    維運平台提供系統健康觀測儀表盤,對系統的健康狀態和運作狀態進行智慧化監測。

    系統健康觀測儀表盤,主要站在使用者體驗的角度,觀測系統的穩定情況、效能情況、維運人效等。並透過觀測請求,匯出問題請求所在的主體(儀表板、範本等)。

    2. 功能簡介

    2.1 使用前提

    健康觀測」依賴鏈路追蹤功能,請先確定開啟鏈路追蹤、配置全局設定等。

    詳情請參見:链路追踪使用前提

    2.2 功能入口

    1)管理者登入FineOps維運平台,選擇維運專案,點選「專案監視>健康觀測」。

    2)使用者可點選篩選不同請求類型。

    請求類型影響指標資料、健康狀況、使用者使用統計、 節點概況表。

    請求類型
    說明
    全部包括下文所有請求類型
    配置類

    開啟目錄、搜尋、計算權限等平台操作行為的請

    非資料類、資源類的其他請求,均為配置類

    資料類

    存取報表、資料表,查看資料結果的相關請求

    資源類前端JS、CSS、字體、圖示等靜態資源請求

    3)使用者可點選切換指定監視時間範圍。

    時間範圍
    說明
    實時監視

    1)當觀測內容為「關鍵指標」和「佔用高記憶體的資源」時:

    時間範圍為過去24小時內

    2)當觀測內容為「趨勢分析」和「問題請求列表」時:

    時間範圍可選過去1h、6h、12h、24h、72h

    歷史分析

    時間範圍可選過去任一月份

    3. 關鍵指標

    介面說明:

    展示五個重點指標。指標值如有異常,會顯示為紅色。

    指標說明:

    指標
    具體說明
    綜合健康指數

    1)指標說明:用於表示系統健康程度的綜合指標

    2)計算邏輯:

    綜合健康得分=(滿意請求數+可容忍請求數/2)/總請求數)*100%

    滿意請求:耗時<3s且成功的請求

    可容忍請求:3s<=耗時<12s、且成功的請求

    3)計算範圍:

    實時監視:過去24小時內

    歷史分析:所選當月範圍內

    4)建議值:建議保持在95%以上

    效能指數APDEX

    1)指標說明:用於評估應用效能的行業標準

    2)計算邏輯:

    APDEX=(滿意請求數+可容忍請求數/2)/總請求數 )*100%

    滿意請求:耗時<3s 的資料類請求、耗時<0.5s 的資源類請求、耗時<0.5s 的配置類請求

    可容忍請求:3s<=耗時<12s 的資料類請求、0.5s<=耗時<2s 的資源類請求、0.5s<=耗時<2s 的配置類請求

    3)計算範圍:

    實時監視:過去24小時內

    歷史分析:所選當月範圍內

    4)建議值:建議保持在95%以上

    請求成功率

    1)指標說明:用於評估應用效能的行業標準

    2)計算邏輯:請求成功率=(成功請求 / 所有請求數) × 100%

    3)計算範圍:

    實時監視:過去24小時內

    歷史分析:所選當月範圍內

    4)建議值:建議保持在95%以上

    併發峯值

    指標說明:

    實時監視:使用請求切片去計算每分鐘的併發數,展示過去24小時內併發量最大值

    歷史分析:使用請求切片去計算每分鐘的併發數,展示所選月份的併發量最大值

    併發使用者峯值

    指標說明:

    實時監視:使用請求切片去計算每分鐘的併發使用者數展示過去24小時內併發使用者數最大值

    歷史分析:使用請求切片去計算每分鐘的併發使用者數,展示所選月份的併發使用者數最大值

    4. 趨勢分析

    4.1 健康狀況

    介面說明:

    展示指定時間範圍內的效能指數、請求成功率。

    • 實時監視下,點選異常點,可聯動跳轉至「鏈路追蹤>呼叫鏈路」頁面,預設帶入查詢時間前後一分鐘進行查詢。

    • 實時監視下,點選異常點,可聯動跳轉至「監視與警報>流量監視」頁面,預設帶入查詢時間前後一分鐘進行查詢。

    • 實時監視下,點選異常點,可同時定位所選時間點的各項指標值。

    指標說明:

    指標
    具體說明
    效能指數APDEX

    1)指標說明:用於評估應用效能的行業標準

    2)計算邏輯:

    APDEX=(滿意請求數+可容忍請求數/2)/總請求數 )*100%

    滿意請求:耗時<3s 的資料類請求、耗時<0.5s 的資源類請求、耗時<0.5s 的配置類請求

    可容忍請求:3s<=耗時<12s 的資料類請求、0.5s<=耗時<2s 的資源類請求、0.5s<=耗時<2s 的配置類請求

    3)建議值:建議保持在95%以上

    請求成功率

    1)指標說明:用於評估應用效能的行業標準

    2)計算邏輯:請求成功率=(成功請求 / 所有請求數) × 100%

    3)建議值:建議保持在95%以上

    4.2 使用者使用統計

    介面說明:

    展示併發峯值和併發使用者峯值。

    • 實時監視下,點選異常點,可聯動跳轉至「鏈路追蹤>呼叫鏈路」頁面,預設帶入查詢時間前後一分鐘進行查詢。

    • 實時監視下,點選異常點,可聯動跳轉至「監視與警報>流量監視」頁面,預設帶入查詢時間前後一分鐘進行查詢。

    • 實時監視下,點選異常點,可同時定位所選時間點的各項指標值。

    指標說明:

    指標
    具體說明
    併發請求峯值

    指標說明:

    實時監視:使用請求切片去計算每分鐘的併發請求數,展示過去24小時內併發請求量最大值

    歷史分析:使用請求切片去計算每分鐘的併發請求數,展示所選月份的併發請求量最大值

    併發使用者峯值

    指標說明:

    實時監視:使用請求切片去計算每分鐘的併發使用者數,展示過去24小時內併發使用者數最大值

    歷史分析:使用請求切片去計算每分鐘的併發使用者數,展示所選月份的併發使用者數最大值

    4.3 節點概況表

    介面說明:展示指定時間範圍內,每個節點的系統健康觀測指標。

    指標說明:指標計算邏輯可參考上文。

    4.4 效能狀況

    介面說明:

    展示指定時間範圍內的看板情況。

    • p90曲線表示有90%的請求耗時都小於該曲線對應值。p95、p99曲線以此類推。

    • 實時監視下,點選服務回應時間、資料回應時間異常點,可聯動跳轉至「鏈路追蹤>首屏鏈路」頁面,預設帶入查詢時間前後一分鐘進行查詢。

    • 實時監視下,點選使用者白屏時間、使用者首屏時間異常點,可聯動跳轉至「鏈路追蹤>呼叫鏈路」頁面,預設帶入查詢時間前後一分鐘進行查詢。

    • 實時監視下,點選異常點,可同時定位所選時間點的各項指標值。

    指標說明:

    指標
    具體說明
    服務回應時間有效請求的平均耗時。伺服器端完成請求回應的時長,用來衡量帆軟整體服務的影響情況
    資料回應時間有效請求的平均耗時。資料引擎/資料庫完成請求回應的時長,用來衡量資料計算的效能情況
    使用者白屏時間使用者開啟一張範本,範本介面完全白屏的時間
    使用者首屏時間使用者開啟一張範本,範本完全載入完成的時間

    5. 問題識別

    5.1 問題請求列表

    介面說明:

    • 展示指定時間範圍內所有報錯請求和耗時超過10S的慢請求。

    • 根據範本資源,統計每個資源的問題類型、查詢次數、影響使用者數

    • 實時監視下,支援「查看鏈路詳情」操作,可聯動跳轉至「鏈路追蹤>呼叫鏈路」頁面,預設帶入sessionID查詢,查詢開始時間元件帶入3天範圍。

    5.2 佔用高記憶體的資源

    介面說明:

    • 展示過去24小時/所選月份內識別到的佔用高記憶體的資源。

    • 根據資源類型,統計每個資源的類型、資源名稱、資源建立者、佔用記憶體、存取使用者、識別時間。

    6. 下一步操作

    下一步操作說明
    健康巡檢

    管理者應當對應用進行定期健康巡檢,確定應用所在的環境及應用內配置合理,以保證應用的正常運作。

    當出現「已有一個月未巡檢,請立即巡檢以發現並修復異常」提示時,建議即刻進行巡檢操作,並配置定期自動巡檢。

    鏈路追蹤維運平台提供「鏈路追蹤」功能,幫助使用者對查詢請求進行採集和分析。

    對於系統健康觀測各個圖表異常處,可點選圖表聯動跳轉查看具體鏈路,定位系統效能異常點。

    對於實時監視下的問題請求列表,可點選跳轉查看具體鏈路,定位系統效能異常點。


    附件列表


    主題: 專案管理
    已經是第一篇
    已經是最後一篇
    • 有幫助
    • 沒幫助
    • 只是瀏覽