1. 概述
1.1 版本
維運平台版本 | 功能變更 |
---|---|
V1.5.5 | - |
V1.5.6 | 節點明細中:新增指標「CodeCache記憶體池」 |
V1.5.9 | 1)節點狀態總覽中:刪除指標「執行緒死鎖數」、「temp目錄磁碟餘量」 2)應用資訊中:新增指標「系統資源優先監視」 3)刪除「BI資源監測」相關內容 |
V1.10.0 | 節點明細中:新增指標「匯流排程使用量監視」、「執行緒類別Top10」 |
1.2 功能簡介
應用監視儀表板用於監視帆軟應用的運作情況。
不同於總覽儀表板,應用監視儀表板可以針對單個節點的運作狀態的詳細資料進行查詢。
1.3 使用前提
如需正常使用本文看板,請務必達成使用前提,詳情請參見:监控仪表板使用前提
2. 範例
2.1 查看看板
1)管理者登入FineOps維運平台,選擇維運專案,點選「專案監視>應用監視」。
2)儀表盤分為多個部分:節點狀態總覽、節點明細、應用資訊。
注:右上角支援切換查看不同時間段的監視資料,預設時間段為前30分鐘,支援查看時間範圍為前15天。
2.2 節點狀態總覽
1)儀表盤範例:
展示所選維運專案中所有節點的總覽資訊,如果出現異常指標將標紅/標黃顯示,透過點選節點名稱可以聯動下方明細指標。
2)儀表板指標說明:
指標 | 具體說明 |
---|---|
節點名稱 | 當前查看的應用的節點名稱 |
節點IP | 當前查看的應用節點的IP和埠號 |
運作時長 | 當前查看的應用節點持續運作的時長,即距離上次啟動的時間 |
物理記憶體佔用 | 當前查看的應用,實際佔用的物理記憶體大小 單位:GiB |
存活對話數 | 當前存活對話數,可以用於瞭解應用的併發峯值情況 |
負載分 | 由於 GC 機制的作用,透過記憶體使用率來表徵 JVM 負載高低的方式並不能很好地反應 JVM 真實負載情況 因此帆軟引入負載分來反應 JVM 真實負載情況,透過GC 回呼來獲取 GC 資料,並準確衡量 JVM 負載的各種狀態 |
記憶體使用率 | 記憶體使用率 = 當前使用的記憶體 / 可以使用的最大記憶體 當前使用的記憶體:當前使用的記憶體大小(位元組) 最大記憶體:可以使用的最大記憶體(位元組),分配給 JVM 的最大記憶體 |
CPU使用率 | CPU使用率 = 採集時刻 CPU 使用率 |
工程磁碟餘量 | 顯示檢查的磁碟剩餘可用的目錄總量 單位:GiB |
logdb目錄磁碟餘量 | 顯示檢查的磁碟剩餘可用的目錄總量 單位:GiB |
tempDir磁碟餘量 | 顯示檢查的磁碟剩餘可用的目錄總量 單位:GiB |
2.3 節點明細
1)儀表盤範例:
展示所選維運專案中指定節點的明細資訊,如果出現異常指標將標紅/標黃顯示,可透過點選上方節點名稱切換。
2)儀表板指標說明:
指標 | 具體說明 |
---|---|
JVM負載 | JVM的負載變化情況 負載是帆軟根據gc資訊計算得出的應用壓力量化方式,相比記憶體能夠更真實的反映應用的壓力情況 負載過高說明應用壓力大,當負載超過80時需要關注是否存在異常 |
JVM記憶體使用率 | JVM的記憶體使用率變化情況 反映應用的客觀記憶體佔用情況,可能包含可被gc回收的記憶體佔用 |
JVMCPU使用率 | JVM的CPU使用率變化情況 反映應用的CPU佔用情況 |
應用進程實際佔用物理記憶體 | 隨時間變化,應用實際佔用的物理記憶體大小 單位:GiB |
GC次數 | 隨時間的gc次數變化情況,gc次數越多通常gc負荷越大 |
GC時間 | 應用每秒花在gc上的時間變化情況 反應gc的負荷和應用的吞吐量,gc時間越長,應用吞吐量越小 |
CodeCache記憶體池 | CodeCache記憶體池的使用量情況,包括CodeCache當前用量和最大可用量 |
檔案開啟數 | 啟動應用的使用者會有最大檔案開啟數的限制,當前應用檔案開啟數接近最大檔案開啟數時,可能會導致後續的存取出現報錯,需要修改啟動使用者的最大檔案開啟數限制 |
各應用目錄磁碟使用情況 | 展示應用相關的root目錄、工程目錄、備份目錄、temp目錄、schedule目錄和logs目錄所在的磁碟空間使用率情況 當使用率超過80%時會飆紅顯示,可用磁碟空間不足可能會影回應用的正常運作甚至當機,需要儘快進行磁碟清理或擴容 |
各目錄磁碟增長情況 | 各個目錄所在磁碟大小的增長情況 如果剩餘空間不足10GB可能會影回應用的正常運作甚至當機,需要儘快進行磁碟清理或擴容 |
對話數曲線 | 當前存活對話數,以及存活對話、新增對話和關閉對話數的變化曲線 可以用於瞭解應用的併發峯值情況 |
容器最大執行緒和當前執行緒 | 包括: 當前已使用http執行緒數 容器http最大執行緒數(實時) 當前已使用https執行緒數 容器https最大執行緒數(實時) |
匯流排程使用量監視 | 應用當前節點使用的匯流排程數量(包括容器執行緒和其他的執行緒),包括: 匯流排程使用量 blocked執行緒量 runnable執行緒量 time_waiting執行緒量 waiting執行緒量 |
執行緒類別Top10 | 當前進程的執行緒總數前十名 |
非同步執行緒池用量監視 | 使用資源調度熔斷插件後的非同步執行緒池監視 |
圖表最大執行緒和當前執行緒 | 圖表當前已使用執行緒數 圖表最大執行緒數(實時) |
長查詢最大佇列執行緒和當前佇列執行緒 | spider圖表當前長查詢執行緒數 spider圖表長查詢等待執行緒數 spider圖表長查詢最大執行緒數 |
短查詢最大佇列執行緒和當前佇列執行緒 | spider圖表當前短查詢執行緒數 spider圖表短查詢等待執行緒數 spider圖表短查詢最大執行緒數 |
執行緒說明 | spider圖表執行緒監視只在BI使用中才會顯示,FR中圖表顯示為空 1)當容器當前已使用執行緒數=容器最大執行緒數時,需要調整容器最大執行緒池數量
2)當spider圖表當前已使用執行緒數=spider圖表最大執行緒數時,需要調整圖表最大執行緒池數量
|
2.4 應用資訊
1)儀表盤範例:
展示所選維運專案中應用的基礎資訊。
2)儀表板指標說明:
指標 | 具體說明 |
---|---|
系統線上使用者數 | 當前線上使用者數和線上使用者曲線,可以用於判斷系統最大線上使用者數 |
系統資源優先監視 | 應用資源優先的相關配置資訊 |
應用版本資訊 | 應用版本資訊,便於進行問題的排查定位 |
JVM參數 | JVM的參數資訊,便於進行問題的排查定位 |
應用插件列表 | 應用的插件列表,便於進行問題的排查定位 |
2.5 FineBI6.1特有指標
1)儀表盤範例:
對於FineBI6.1工程,提供部分特有指標,幫助使用者進行專案監視。
2)儀表板指標說明:
指標 | 具體說明 |
---|---|
FineBI應用節點存活數 | 存活的bi-web節點數量 |
元資料節點存活數 | 存活的master節點數量 |
引擎計算節點存活數 | 存活的worker節點數量 |
資料儲存服務磁碟用量 | 展示磁碟已用和剩餘可用佔比 |
引擎正在執行的任務數量 | TaskState在RUNNING之前的任務 |
引擎等待執行的任務數量 | TaskState為RUNNING的任務 |
引擎已經中止的任務數量 | TaskState為終止態的任務的數量 包括:FINISHED、FAILED、CANCELLED |