反馈已提交

网络繁忙

应用监控

  • 文档创建者:Carly
  • 历史版本:12
  • 最近更新:Carly 于 2024-11-11
  • 1. 概述

    1.1 版本

    运维平台版本
    功能变更
    V1.5.5-
    V1.5.6节点明细中:新增指标「CodeCache内存池
    V1.5.9

    1)节点状态总览中:删除指标「线程死锁数」、「temp目录磁盘余量

    2)应用信息中:新增指标「系统资源优先级监控」

    3)删除「BI资源监测」相关内容

    V1.10.0

    节点明细中:新增指标「总线程使用量监控」、「线程类别Top10」

    V2.7.1新增FineBI6.1相关特有指标
    V2.8.0节点明细中:新增指标「NIO内存用量」、「Metaspace内存池」、「配置库连接池状态」、「Redis连接池状态」
    V2.11.0节点明细中:对于FineBI6.1.3及以上版本项目,新增指标「BI配置缓存监控」和「BI配置缓存命中率」

    1.2 功能简介

    应用监控仪表板用于监控帆软应用的运行情况。

    不同于总览仪表板,应用监控仪表板可以针对单个节点的运行状态的详细数据进行查询。

    1.3 使用前提

    如需正常使用本文看板,请务必达成使用前提,详情请参见:监控仪表板使用前提

    2. 示例

    2.1 查看看板

    1)管理员登录FineOps运维平台,选择运维项目,点击「项目监控>应用监控」。

    2)仪表盘分为多个部分:BI6.1独有指标一览、节点状态总览、节点明细、应用信息。

    注:右上角支持切换查看不同时间段的监控数据,默认时间段为前30分钟,支持查看时间范围为前15天。

    2.2 节点状态总览

    1)仪表盘示例:

    展示所选运维项目中所有节点的总览信息,如果出现异常指标将标红/标黄显示,通过点击节点名称可以联动下方明细指标。

    2)仪表板指标说明:

    指标
    具体说明
    节点类型

    仅FineBI6.1项目展示

    应用节点:bi-web

    引擎计算节点:bi-engine-worker

    元数据节点:bi-engine-master

    节点IP当前查看的应用节点的IP和端口号
    运行时长
    当前查看的应用节点持续运行的时长,即距离上次启动的时间
    物理内存占用

    当前查看的应用,实际占用的物理内存大小

    单位:GiB

    存活会话数当前存活会话数,可以用于了解应用的并发峰值情况
    负载分由于 GC 机制的作用,通过内存使用率来表征 JVM 负载高低的方式并不能很好地反应 JVM 真实负载情况

    因此帆软引入负载分来反应 JVM 真实负载情况,通过GC 回调来获取 GC 数据,并准确衡量 JVM 负载的各种状态

    内存使用率内存使用率 = 当前使用的内存 / 可以使用的最大内存

    当前使用的内存:当前使用的内存大小(字节)

    最大内存:可以使用的最大内存(字节),分配给 JVM 的最大内存

    CPU使用率CPU使用率 = 采集时刻 CPU 使用率
    工程磁盘余量

    显示检查的磁盘剩余可用的目录总量

    单位:GiB

    logdb目录磁盘余量

    显示检查的磁盘剩余可用的目录总量

    单位:GiB

    tempDir磁盘余量显示检查的磁盘剩余可用的目录总量

    单位:GiB

    2.3 节点明细

    1)仪表盘示例:

    展示所选运维项目中指定节点的明细信息,如果出现异常指标将标红/标黄显示,可通过点击上方节点名称切换。

    2)仪表板指标说明:

    指标
    具体说明
    JVM负载

    JVM的负载变化情况

    负载是帆软根据gc信息计算得出的应用压力量化方式,相比内存能够更真实的反映应用的压力情况

    负载过高说明应用压力大,当负载超过80时需要关注是否存在异常

    JVM内存使用率

    JVM的内存使用率变化情况

    反映应用的客观内存占用情况,可能包含可被gc回收的内存占用

    JVMCPU使用率

    JVM的CPU使用率变化情况

    反映应用的CPU占用情况

    应用进程实际占用物理内存

    随时间变化,应用实际占用的物理内存大小

    单位:GiB

    GC次数

    随时间的gc次数变化情况,gc次数越多通常gc负荷越大

    GC时间

    应用每秒花在gc上的时间变化情况

    反应gc的负荷和应用的吞吐量,gc时间越长,应用吞吐量越小

    CodeCache内存池CodeCache内存池的使用量情况,包括CodeCache当前用量和最大可用量
    NIO内存用量

    NIO内存池的使用量情况,包括:NIO当前用量、NIO最大可用

    单位:GiB

    Metaspace内存池Metaspace内存池的使用量情况,包括:Metaspace当前用量、Metaspace最大可用

    单位:GiB

    配置库连接池状态

    工程配置库连接池的最大连接数和已用连接

    请注意,此处指的是帆软应用可用的连接池,非数据库本身的连接池

    包括:已使用连接数、最大可用连接数

    Redis连接池状态

    工程Redis连接的最大连接数和已用连接数

    请注意,此处指的是帆软应用可用的连接池,非Redis本身的连接池

    当前仅支持redis单机及哨兵模式,其他类型Redis不支持监控

    包括:已使用连接数、最大可用连接数

    文件打开数

    启动应用的用户会有最大文件打开数的限制,当前应用文件打开数接近最大文件打开数时,可能会导致后续的访问出现报错,需要修改启动用户的最大文件打开数限制

    各应用目录磁盘使用情况

    展示应用相关的root目录、工程目录、备份目录、temp目录、schedule目录和logs目录所在的磁盘空间使用率情况

    当使用率超过80%时会飙红显示,可用磁盘空间不足可能会影响应用的正常运行甚至宕机,需要尽快进行磁盘清理或扩容

    各目录磁盘增长情况

    各个目录所在磁盘大小的增长情况

    如果剩余空间不足10GB可能会影响应用的正常运行甚至宕机,需要尽快进行磁盘清理或扩容

    会话数曲线

    当前存活会话数,以及存活会话、新增会话和关闭会话数的变化曲线

    可以用于了解应用的并发峰值情况

    BI配置缓存监控

    FineBI6.1.3及以上版本项目独有

    监控BI配置缓存的具体指标,包括命中、未命中、驱逐和访问总数

    BI配置缓存命中率

    FineBI6.1.3及以上版本项目独有

    监控BI配置缓存的命中率

    容器最大线程和当前线程

    包括:

    当前已使用http线程数

    容器http最大线程数(实时)

    当前已使用https线程数

    容器https最大线程数(实时)

    总线程使用量监控

    应用当前节点使用的总线程数量(包括容器线程和其他的线程),包括:

    总线程使用量

    blocked线程量

    runnable线程量

    time_waiting线程量

    waiting线程量

    线程类别Top10当前进程的线程总数前十名
    异步线程池用量监控使用资源调度熔断插件后的异步线程池监控
    图表最大线程和当前线程

    图表当前已使用线程数

    图表最大线程数(实时)

    长查询最大排队线程和当前排队线程

    spider图表当前长查询线程数

    spider图表长查询等待线程数

    spider图表长查询最大线程数

    短查询最大排队线程和当前排队线程

    spider图表当前短查询线程数

    spider图表短查询等待线程数

    spider图表短查询最大线程数

    线程说明

    spider图表线程监控只在BI使用中才会显示,FR中图表显示为空

    1)当容器当前已使用线程数=容器最大线程数时,需要调整容器最大线程池数量

    • 非容器化部署:修改 Tomcat/conf/server.xml配置文件,调整maxThreads到合适大小(建议范围200~2000),需重启生效

    • 容器化部署:可在运维平台-运维工具-容器管理中可视化修改参数,修改参数名和数值同上

    2)当spider图表当前已使用线程数=spider图表最大线程数时,需要调整图表最大线程池数量

    • 非容器化部署:修改finedb中FINE_CONF_ENTITY表配置信息,调整SystemOptimizationConfig.chartDataThreadPoolNum到合适大小(建议范围8~50),需重启生效

    • 容器化部署:可在运维平台-配置管理中可视化修改参数,修改参数名和数值同上

    2.4 应用信息

    1)仪表盘示例:

    展示所选运维项目中应用的基础信息。

    2)仪表板指标说明:

    指标
    具体说明
    系统在线用户数当前在线用户数和在线用户曲线,可以用于判断系统最大在线用户数
    系统资源优先级监控应用资源优先级的相关配置信息
    应用版本信息应用版本信息,便于进行问题的排查定位
    JVM参数JVM的参数信息,便于进行问题的排查定位
    应用插件列表应用的插件列表,便于进行问题的排查定位

    2.5 FineBI6.1特有指标

    1)仪表盘示例:

    对于FineBI6.1工程,提供部分特有指标,帮助用户进行项目监控。

    2)仪表板指标说明:

    指标
    具体说明
    FineBI应用节点存活数存活的bi-web节点数量
    元数据节点存活数存活的master节点数量
    引擎计算节点存活数存活的worker节点数量
    数据存储服务磁盘用量展示磁盘已用和剩余可用占比
    引擎正在执行的任务数量TaskState在RUNNING之前的任务
    引擎等待执行的任务数量TaskState为RUNNING的任务
    引擎已经中止的任务数量

    TaskState为终止态的任务的数量

    包括:FINISHED、FAILED、CANCELLED


    附件列表


    主题: 项目管理
    • 有帮助
    • 没帮助
    • 只是浏览
    • 评价文档,奖励 1 ~ 100 随机 F 豆!

    鼠标选中内容,快速反馈问题

    鼠标选中存在疑惑的内容,即可快速反馈问题,我们将会跟进处理。

    不再提示

    10s后关闭

    联系我们
    在线支持
    获取专业技术支持,快速帮助您解决问题
    工作日9:00-12:00,13:30-17:30在线
    页面反馈
    针对当前网页的建议、问题反馈
    售前咨询
    采购需求/获取报价/预约演示
    或拨打: 400-811-8890 转1
    qr
    热线电话
    咨询/故障救援热线:400-811-8890转2
    总裁办24H投诉:17312781526
    提交页面反馈
    仅适用于当前网页的意见收集,帆软产品问题请在 问答板块提问前往服务平台 获取技术支持