1. 概述
1.1 版本
維運平台版本 | 功能變更 |
---|---|
V1.5.5 | - |
V1.5.6 | 系統健康觀測介面展示優化 1)請求併發量和線上使用者數,優化為併發峯值和併發使用者峯值 2)各指標圖支援互相「定位當前時間」 3)各指標圖支援拖動調整時間區間 4)各指標圖支援放大查看 |
V1.5.8 | 新增「佔用高記憶體的資源」清單 |
V1.5.9 | 1)新增「健康巡檢」強提醒按鈕 2)各指標圖和明細表標題聯動顯示時間點,快速定位時間 |
V1.10.0 | 1)新增模組切換、請求類型篩選等全局元件 2)「節點情況明細表」更名為「節點概況表」 |
V1.12.0 | 為確定精確定位鏈路資訊,系統健康觀測聯動跳轉鏈路詳情時,部分跳轉項從「首屏鏈路」調整為「呼叫鏈路」 |
V2.3.0 | 優化效能指數APDEX計算邏輯,提高效能標準,為使用者提供更好的效能體驗 |
1.2 功能簡介
維運平台提供系統健康觀測儀表盤,對系統的健康狀態和運作狀態進行智慧化監測。
系統健康觀測儀表盤,主要站在使用者體驗的角度,觀測系統的穩定情況、效能情況、維運人效等。並透過觀測請求,匯出問題請求所在的主體(儀表板、範本等)。
2. 功能簡介
2.1 使用前提
「健康觀測」依賴鏈路追蹤功能,請先確定開啟鏈路追蹤、配置全局設定等。
詳情請參見:链路追踪使用前提
2.2 功能入口
1)管理者登入FineOps維運平台,選擇維運專案,點選「專案監視>健康觀測」。
2)使用者可點選篩選不同請求類型。
請求類型影響指標資料、健康狀況、使用者使用統計、 節點概況表。
請求類型 | 說明 |
---|---|
全部 | 包括下文所有請求類型 |
配置類 | 開啟目錄、搜尋、計算權限等平台操作行為的請求 非資料類、資源類的其他請求,均為配置類 |
資料類 | 存取報表、資料表,查看資料結果的相關請求 |
資源類 | 前端JS、CSS、字體、圖示等靜態資源請求 |
3)使用者可點選切換指定監視時間範圍。
時間範圍 | 說明 |
---|---|
實時監視 | 1)當觀測內容為「關鍵指標」和「佔用高記憶體的資源」時: 時間範圍為過去24小時內 2)當觀測內容為「趨勢分析」和「問題請求列表」時: 時間範圍可選過去1h、6h、12h、24h、72h |
歷史分析 | 時間範圍可選過去任一月份 |
3. 關鍵指標
介面說明:
展示五個重點指標。指標值如有異常,會顯示為紅色。
指標說明:
指標 | 具體說明 |
---|---|
綜合健康指數 | 1)指標說明:用於表示系統健康程度的綜合指標 2)計算邏輯: 綜合健康得分=(滿意請求數+可容忍請求數/2)/總請求數)*100% 滿意請求:耗時<3s且成功的請求 可容忍請求:3s<=耗時<12s、且成功的請求 3)計算範圍: 實時監視:過去24小時內 歷史分析:所選當月範圍內 4)建議值:建議保持在95%以上 |
效能指數APDEX | 1)指標說明:用於評估應用效能的行業標準 2)計算邏輯: APDEX=(滿意請求數+可容忍請求數/2)/總請求數 )*100% 滿意請求:耗時<3s 的資料類請求、耗時<0.5s 的資源類請求、耗時<0.5s 的配置類請求 可容忍請求:3s<=耗時<12s 的資料類請求、0.5s<=耗時<2s 的資源類請求、0.5s<=耗時<2s 的配置類請求 3)計算範圍: 實時監視:過去24小時內 歷史分析:所選當月範圍內 4)建議值:建議保持在95%以上 |
請求成功率 | 1)指標說明:用於評估應用效能的行業標準 2)計算邏輯:請求成功率=(成功請求 / 所有請求數) × 100% 3)計算範圍: 實時監視:過去24小時內 歷史分析:所選當月範圍內 4)建議值:建議保持在95%以上 |
併發峯值 | 指標說明: 實時監視:使用請求切片去計算每分鐘的併發數,展示過去24小時內併發量最大值 歷史分析:使用請求切片去計算每分鐘的併發數,展示所選月份的併發量最大值 |
併發使用者峯值 | 指標說明: 實時監視:使用請求切片去計算每分鐘的併發使用者數,展示過去24小時內併發使用者數最大值 歷史分析:使用請求切片去計算每分鐘的併發使用者數,展示所選月份的併發使用者數最大值 |
4. 趨勢分析
4.1 健康狀況
介面說明:
展示指定時間範圍內的效能指數、請求成功率。
實時監視下,點選異常點,可聯動跳轉至「鏈路追蹤>呼叫鏈路」頁面,預設帶入查詢時間前後一分鐘進行查詢。
實時監視下,點選異常點,可聯動跳轉至「監視與警報>流量監視」頁面,預設帶入查詢時間前後一分鐘進行查詢。
實時監視下,點選異常點,可同時定位所選時間點的各項指標值。
指標說明:
指標 | 具體說明 |
---|---|
效能指數APDEX | 1)指標說明:用於評估應用效能的行業標準 2)計算邏輯: APDEX=(滿意請求數+可容忍請求數/2)/總請求數 )*100% 滿意請求:耗時<3s 的資料類請求、耗時<0.5s 的資源類請求、耗時<0.5s 的配置類請求 可容忍請求:3s<=耗時<12s 的資料類請求、0.5s<=耗時<2s 的資源類請求、0.5s<=耗時<2s 的配置類請求 3)建議值:建議保持在95%以上 |
請求成功率 | 1)指標說明:用於評估應用效能的行業標準 2)計算邏輯:請求成功率=(成功請求 / 所有請求數) × 100% 3)建議值:建議保持在95%以上 |
4.2 使用者使用統計
介面說明:
展示併發峯值和併發使用者峯值。
實時監視下,點選異常點,可聯動跳轉至「鏈路追蹤>呼叫鏈路」頁面,預設帶入查詢時間前後一分鐘進行查詢。
實時監視下,點選異常點,可聯動跳轉至「監視與警報>流量監視」頁面,預設帶入查詢時間前後一分鐘進行查詢。
實時監視下,點選異常點,可同時定位所選時間點的各項指標值。
指標說明:
指標 | 具體說明 |
---|---|
併發請求峯值 | 指標說明: 實時監視:使用請求切片去計算每分鐘的併發請求數,展示過去24小時內併發請求量最大值 歷史分析:使用請求切片去計算每分鐘的併發請求數,展示所選月份的併發請求量最大值 |
併發使用者峯值 | 指標說明: 實時監視:使用請求切片去計算每分鐘的併發使用者數,展示過去24小時內併發使用者數最大值 歷史分析:使用請求切片去計算每分鐘的併發使用者數,展示所選月份的併發使用者數最大值 |
4.3 節點概況表
介面說明:展示指定時間範圍內,每個節點的系統健康觀測指標。
指標說明:指標計算邏輯可參考上文。
4.4 效能狀況
介面說明:
展示指定時間範圍內的看板情況。
p90曲線表示有90%的請求耗時都小於該曲線對應值。p95、p99曲線以此類推。
實時監視下,點選服務回應時間、資料回應時間異常點,可聯動跳轉至「鏈路追蹤>首屏鏈路」頁面,預設帶入查詢時間前後一分鐘進行查詢。
實時監視下,點選使用者白屏時間、使用者首屏時間異常點,可聯動跳轉至「鏈路追蹤>呼叫鏈路」頁面,預設帶入查詢時間前後一分鐘進行查詢。
實時監視下,點選異常點,可同時定位所選時間點的各項指標值。
指標說明:
指標 | 具體說明 |
---|---|
服務回應時間 | 有效請求的平均耗時。伺服器端完成請求回應的時長,用來衡量帆軟整體服務的影響情況 |
資料回應時間 | 有效請求的平均耗時。資料引擎/資料庫完成請求回應的時長,用來衡量資料計算的效能情況 |
使用者白屏時間 | 使用者開啟一張範本,範本介面完全白屏的時間 |
使用者首屏時間 | 使用者開啟一張範本,範本完全載入完成的時間 |
5. 問題識別
5.1 問題請求列表
介面說明:
展示指定時間範圍內所有報錯請求和耗時超過10S的慢請求。
根據範本資源,統計每個資源的問題類型、查詢次數、影響使用者數
實時監視下,支援「查看鏈路詳情」操作,可聯動跳轉至「鏈路追蹤>呼叫鏈路」頁面,預設帶入sessionID查詢,查詢開始時間元件帶入3天範圍。
5.2 佔用高記憶體的資源
介面說明:
展示過去24小時/所選月份內識別到的佔用高記憶體的資源。
根據資源類型,統計每個資源的類型、資源名稱、資源建立者、佔用記憶體、存取使用者、識別時間。