應用監視

  • 最後修改時間:2025-01-17
  • 1. 概述

    1.1 版本

    維運平台版本
    功能變更
    V1.5.5-
    V1.5.6節點明細中:新增指標「CodeCache記憶體池
    V1.5.9

    1)節點狀態總覽中:刪除指標「執行緒死鎖數」、「temp目錄磁碟餘量

    2)應用資訊中:新增指標「系統資源優先監視」

    3)刪除「BI資源監測」相關內容

    V1.10.0

    節點明細中:新增指標「匯流排程使用量監視」、「執行緒類別Top10」

    1.2 功能簡介

    應用監視儀表板用於監視帆軟應用的運作情況。

    不同於總覽儀表板,應用監視儀表板可以針對單個節點的運作狀態的詳細資料進行查詢。

    1.3 使用前提

    如需正常使用本文看板,請務必達成使用前提,詳情請參見:监控仪表板使用前提

    2. 範例

    2.1 查看看板

    1)管理者登入FineOps維運平台,選擇維運專案,點選「專案監視>應用監視」。

    2)儀表盤分為多個部分:節點狀態總覽、節點明細、應用資訊。

    注:右上角支援切換查看不同時間段的監視資料,預設時間段為前30分鐘,支援查看時間範圍為前15天。

    2.2 節點狀態總覽

    1)儀表盤範例:

    展示所選維運專案中所有節點的總覽資訊,如果出現異常指標將標紅/標黃顯示,透過點選節點名稱可以聯動下方明細指標。

    2)儀表板指標說明:

    指標
    具體說明
    節點名稱當前查看的應用的節點名稱
    節點IP當前查看的應用節點的IP和埠號
    運作時長
    當前查看的應用節點持續運作的時長,即距離上次啟動的時間
    物理記憶體佔用

    當前查看的應用,實際佔用的物理記憶體大小

    單位:GiB

    存活對話數當前存活對話數,可以用於瞭解應用的併發峯值情況
    負載分由於 GC 機制的作用,透過記憶體使用率來表徵 JVM 負載高低的方式並不能很好地反應 JVM 真實負載情況

    因此帆軟引入負載分來反應 JVM 真實負載情況,透過GC 回呼來獲取 GC 資料,並準確衡量 JVM 負載的各種狀態

    記憶體使用率記憶體使用率 = 當前使用的記憶體 / 可以使用的最大記憶體

    當前使用的記憶體:當前使用的記憶體大小(位元組)

    最大記憶體:可以使用的最大記憶體(位元組),分配給 JVM 的最大記憶體

    CPU使用率CPU使用率 = 採集時刻 CPU 使用率
    工程磁碟餘量

    顯示檢查的磁碟剩餘可用的目錄總量

    單位:GiB

    logdb目錄磁碟餘量

    顯示檢查的磁碟剩餘可用的目錄總量

    單位:GiB

    tempDir磁碟餘量顯示檢查的磁碟剩餘可用的目錄總量

    單位:GiB

    2.3 節點明細

    1)儀表盤範例:

    展示所選維運專案中指定節點的明細資訊,如果出現異常指標將標紅/標黃顯示,可透過點選上方節點名稱切換。

    2)儀表板指標說明:

    指標
    具體說明
    JVM負載

    JVM的負載變化情況

    負載是帆軟根據gc資訊計算得出的應用壓力量化方式,相比記憶體能夠更真實的反映應用的壓力情況

    負載過高說明應用壓力大,當負載超過80時需要關注是否存在異常

    JVM記憶體使用率

    JVM的記憶體使用率變化情況

    反映應用的客觀記憶體佔用情況,可能包含可被gc回收的記憶體佔用

    JVMCPU使用率

    JVM的CPU使用率變化情況

    反映應用的CPU佔用情況

    應用進程實際佔用物理記憶體

    隨時間變化,應用實際佔用的物理記憶體大小

    單位:GiB

    GC次數

    隨時間的gc次數變化情況,gc次數越多通常gc負荷越大

    GC時間

    應用每秒花在gc上的時間變化情況

    反應gc的負荷和應用的吞吐量,gc時間越長,應用吞吐量越小

    CodeCache記憶體池CodeCache記憶體池的使用量情況,包括CodeCache當前用量和最大可用量
    檔案開啟數

    啟動應用的使用者會有最大檔案開啟數的限制,當前應用檔案開啟數接近最大檔案開啟數時,可能會導致後續的存取出現報錯,需要修改啟動使用者的最大檔案開啟數限制

    各應用目錄磁碟使用情況

    展示應用相關的root目錄、工程目錄、備份目錄、temp目錄、schedule目錄和logs目錄所在的磁碟空間使用率情況

    當使用率超過80%時會飆紅顯示,可用磁碟空間不足可能會影回應用的正常運作甚至當機,需要儘快進行磁碟清理或擴容

    各目錄磁碟增長情況

    各個目錄所在磁碟大小的增長情況

    如果剩餘空間不足10GB可能會影回應用的正常運作甚至當機,需要儘快進行磁碟清理或擴容

    對話數曲線

    當前存活對話數,以及存活對話、新增對話和關閉對話數的變化曲線

    可以用於瞭解應用的併發峯值情況

    容器最大執行緒和當前執行緒

    包括:

    當前已使用http執行緒數

    容器http最大執行緒數(實時)

    當前已使用https執行緒數

    容器https最大執行緒數(實時)

    匯流排程使用量監視

    應用當前節點使用的匯流排程數量(包括容器執行緒和其他的執行緒),包括:

    匯流排程使用量

    blocked執行緒量

    runnable執行緒量

    time_waiting執行緒量

    waiting執行緒量

    執行緒類別Top10當前進程的執行緒總數前十名
    非同步執行緒池用量監視使用資源調度熔斷插件後的非同步執行緒池監視
    圖表最大執行緒和當前執行緒

    圖表當前已使用執行緒數

    圖表最大執行緒數(實時)

    長查詢最大佇列執行緒和當前佇列執行緒

    spider圖表當前長查詢執行緒數

    spider圖表長查詢等待執行緒數

    spider圖表長查詢最大執行緒數

    短查詢最大佇列執行緒和當前佇列執行緒

    spider圖表當前短查詢執行緒數

    spider圖表短查詢等待執行緒數

    spider圖表短查詢最大執行緒數

    執行緒說明

    spider圖表執行緒監視只在BI使用中才會顯示,FR中圖表顯示為空

    1)當容器當前已使用執行緒數=容器最大執行緒數時,需要調整容器最大執行緒池數量

    • 非容器化部署:修改 Tomcat/conf/server.xml配置檔案,調整maxThreads到合適大小(建議範圍200~2000),需重啟生效

    • 容器化部署:可在維運平台-維運工具-容器管理中視覺化修改參數,修改參數名和數值同上

    2)當spider圖表當前已使用執行緒數=spider圖表最大執行緒數時,需要調整圖表最大執行緒池數量

    • 非容器化部署:修改finedb中FINE_CONF_ENTITY表配置資訊,調整SystemOptimizationConfig.chartDataThreadPoolNum到合適大小(建議範圍8~50),需重啟生效

    • 容器化部署:可在維運平台-配置管理中視覺化修改參數,修改參數名和數值同上

    2.4 應用資訊

    1)儀表盤範例:

    展示所選維運專案中應用的基礎資訊。

    2)儀表板指標說明:

    指標
    具體說明
    系統線上使用者數當前線上使用者數和線上使用者曲線,可以用於判斷系統最大線上使用者數
    系統資源優先監視應用資源優先的相關配置資訊
    應用版本資訊應用版本資訊,便於進行問題的排查定位
    JVM參數JVM的參數資訊,便於進行問題的排查定位
    應用插件列表應用的插件列表,便於進行問題的排查定位

    2.5 FineBI6.1特有指標

    1)儀表盤範例:

    對於FineBI6.1工程,提供部分特有指標,幫助使用者進行專案監視。

    2)儀表板指標說明:

    指標
    具體說明
    FineBI應用節點存活數存活的bi-web節點數量
    元資料節點存活數存活的master節點數量
    引擎計算節點存活數存活的worker節點數量
    資料儲存服務磁碟用量展示磁碟已用和剩餘可用佔比
    引擎正在執行的任務數量TaskState在RUNNING之前的任務
    引擎等待執行的任務數量TaskState為RUNNING的任務
    引擎已經中止的任務數量

    TaskState為終止態的任務的數量

    包括:FINISHED、FAILED、CANCELLED


    附件列表


    主題: 專案管理
    已經是第一篇
    已經是最後一篇
    • 有幫助
    • 沒幫助
    • 只是瀏覽