历史版本5 :组件监控 返回文档
编辑时间: 内容长度:图片数:目录数: 修改原因:

目录:

1. 概述编辑

1.1 版本

运维平台版本
功能变更
V1.5.5-

1.2 功能简介

应用场景:

组件监控,主要用来监控运维项目中,各类组件(外接数据库、Nginx、Elasticsearch等)的运行状况,使用情况等。

功能入口:

管理员登录FineOps运维平台,点击「监控与告警>组件监控」,即可查看各类组件监控仪表盘。

仪表盘分为多个部分:外接数据库监控、Redis监控、Nginx监控、Elasticsearch监控、Minio监控。

2. 使用前提编辑

2.1 运维项目要求

  • 非容器化项目安装exporter组件

仪表盘中的数据,由相关exporter指标收集组件提供。容器化部署的帆软项目,默认安装了相关组件。

非容器化部署的帆软项目,在接入运维平台时,需要安装相关组件,否则无法正常使用本文功能。

请确保参考「接入已有非容器化项目」文档,安装了相关日志信息采集和服务器信息采集组件。

  • 组件是否存在

根据运维项目中的组件构成,会导致下文提及的部分仪表盘不存在。

例如若未安装Elasticsearch组件,则不显示Elasticsearch监控仪表盘。

例如若未安装MinIO组件,则不显示MinIO监控仪表盘。

2.2 运维平台要求

仪表盘功能,由这些运维组件提供:grafana、prometheus

因此如需正常查看相关仪表盘,需要确保这些组件正常运行。

管理员登录运维平台,点击「运维管理>运维组件」,可启动相关组件。

3. 外接数据库监控编辑

外接数据库监控主要用来监控外接数据库的压力情况,避免因为外接数据库的不稳定而影响帆软系统的正常使用。

注:仅支持监控MySQL5.6以上版本外接数据库。

1)仪表板示例:

2)仪表板指标说明:

指标
具体说明
是否存活外接数据库是否存活
运行时长外接数据库举例上次启动的时长
缓冲池大小缓冲池大小,内存允许的情况下缓冲池越大性能越好
缓冲池利用率
展示一段时间内缓冲池利用率的变化趋势
磁盘读取请求次数磁盘读取请求次数,磁盘读取请求次数持续增长可能出现外接数据库性能差,磁盘io压力大等问题
连接数展示外接数据库的剩余连接数和实例拒绝连接数,如果剩余连接数不足可能会出现应用访问异常
QPS展示外接数据库每秒处理的请求数量,用来判断外接数据库的压力情况
正在查询的数量展示外接数据库正在查询的语句数量,持续增长可能说明外接数据库超负荷
慢查询数量展示外接数据库的慢查询数量,如果慢查询数量持续增长可能影响外接数据库的性能及可用性,需要关注具体慢查询的情况
死锁信息展示数据库的死锁信息:

ts:检测到死锁的时间戳

thread:产生死锁的线程id,这个id和show processlist里面的线程id是一致的

txn_id:innodb的事务ID

txd_time:死锁检查到前,事务执行时间

user:执行transcation的用户名

db:发生死锁的DB名

tbl:死锁发生的表名

idx:产生死锁的索引名(在上面这个demo里面, 我们直接走的主键,加的记录锁)

lock_type:锁的类型(记录锁,gap锁,next-key锁)

lock_mode:锁模式(S,X)

wait_hold:是否等着锁释放,一般死锁都是两个wait

victim:该会话是否做了牺牲,终止了执行

query:造成死锁的SQL语句

4. Redis监控编辑

Redis监控仪表板用于监控帆软系统使用的Redis状态服务器的运行情况。

1)仪表板示例:

2)仪表板指标说明:

指标
具体说明
是否存活redis的存活状态
redis版本redis的版本
模式
单机还是集群
运行时长redis本次启动的运行时长
集群活跃节点数集群活跃的节点数
主节点数集群主节点数量
从节点数集群从节点数量
redis内存信息redis分配的内存和使用情况,通常来说redis内存占用比较小,如果出现内存使用率很高,那么可能存在异常
内存使用率曲线一段时间内已用内存在分配内存中的占比
内存碎片率

内存碎片率表示「Redis向操作系统中申请的内存」 与「分配器分配的内存总量」的比值

指数>1表明有内存碎片,越大表明越多,<1表明正在使用虚拟内存,虚拟内存其实就是硬盘,性能比内存低得多,这是应该增强机器的内存以提高性能。
一般来说,内存碎片率数值在1 ~ 1.5之间是比较健康的。

大于1.5表示,系统分配的内存大于Redis实际使用的内存,Redis没有把这部分内存返还给系统,产生了很多内存碎片。在Redis 4.0版以前,只能通过安全重启解决这个问题。Redis 4.0及以上版本可以支持内存自动清理。

小于1表示,系统分配的内存小于Redis实际使用的内存,而Redis很有可能在使用Swap了!使用swap是相当影响性能的。

客户端连接个数用于查看当前redis的客户端连接个数,默认的客户端连接数最大限制为10000,如果连接数过高,会影响redis吞吐量。>5000   时通常就需要进行告警
redis每秒执行的命令数展示一段时间内redis每秒执行命令数的曲线
每秒查找数据库键成功/失败的次数展示每秒查找数据库的hit/miss的次数,用于参考根据业务需求调优Redis配置
过期/未过期数据库键数展示redis中过期/未过期数据库键数,用于参考根据业务需求调优Redis配置

5. Nginx监控编辑

Nginx监控仪表板用于监控帆软系统使用的Nginx服务器的运行情况,重点关注的是请求情况。

1)仪表板示例:


2)仪表板指标说明:

指标
具体说明
是否存活Nginx的存活状态
读取客户端的连接数展示当前读取中的客户端连接数
回写客户端的连接数展示当前回写中的客户端连接数
等待中的客户端的链接数展示当前等待中的客户端连接数
用户请求总数展示一段时间内的用户请求总数变化情况
活跃用户连接数展示一段时间内活跃的用户连接数变化的情况
接收到的用户连接数展示一段时间内接收到的用户连接数变化情况
处理的用户连接数展示一段时间内处理的用户连接数变化情况

6. Elasticsearch监控编辑

注:若未安装Elasticsearch组件,则不显示Elasticsearch监控仪表盘。

1)仪表板示例:


7. Minio监控编辑

注:若未安装Minio组件,则不显示Minio监控仪表盘。

1)仪表板示例: