1. 概述
1.1 版本
运维平台版本 | 功能变更 |
---|---|
V2.0.0 | - |
1.2 应用场景
一个运维平台可能对接多个运维项目,管理员查看项目监控看板时,需要一个个切换查看,无法快速了解所有项目情况。
因此FineOpsV2.0版本,将每个项目的项目负载和服务器负载概览独立出来,组成所有运维项目的资源监控一览表。
1.3 使用前提
如需正常使用本文看板,请务必达成使用前提,详情请参见:监控仪表板使用前提
2. 项目负载监控
仪表盘示例:
管理员登录运维平台,点击「资源监控>项目负载监控」。
该列表展示运维平台对接的所有运维项目的每个应用的总览信息,如果出现异常指标将标红/标黄显示。
注1:点击项目名称可以联动跳转至运维项目的「项目监控>资源监控」详情页面。
注2:页面右上角支持切换查看不同时间段的监控数据,默认时间段为前30分钟,支持查看时间范围为前15天。
仪表盘指标说明:
指标 | 具体说明 |
---|---|
项目名称 | 项目的名称 |
节点 | 项目应用节点所在IP和占用端口 |
进程占用物理内存 | 应用实际占用的物理内存大小 单位:GiB |
外接数据库 | 应用与外接数据库的连接状态 结果可能为:连通、断开、未设置(未使用外接)和部分节点异常(集群) |
文件服务器 | 应用与文件服务器的连接状态 结果可能为:连通、断开、未设置(未使用文件服务器)和部分节点异常(集群) |
状态服务器 | 应用与状态服务器的连接状态 结果可能为:连通、断开、未设置(未使用状态服务器)和部分节点异常(集群) |
内存使用率 | 内存使用率 = 当前使用的内存 / 可以使用的最大内存 当前使用的内存:当前使用的内存大小(字节) 最大内存:可以使用的最大内存(字节),分配给 JVM 的最大内存 |
CPU使用率 | CPU使用率 = 采集时刻 CPU 使用率 |
3. 服务器负载监控
仪表盘示例:
管理员登录运维平台,点击「资源监控>项目负载监控」。
该列表展示运维平台对接的所有运维项目的每个服务器的总览信息,如果出现异常指标将标红/标黄显示。
注1:点击项目名称可以联动跳转至运维项目的「项目监控>服务器监控」详情页面。
注2:页面右上角支持切换查看不同时间段的监控数据,默认时间段为前30分钟,支持查看时间范围为前15天。
注3:如果有多个网卡或者多个分区,是采集的使用率最高的网卡或者分区的数值。
仪表盘指标说明:
指标 | 具体说明 |
---|---|
IP | 项目涉及的服务器IP |
归属项目 | 该服务器所属的项目名称 |
内存 | 该服务器内存总量 |
CPU核 | 该服务器CPU核数 |
运行时间 | 该服务器持续运行时长 |
5m负载 | 改务区5分钟内CPU负载 |
CPU使用率 | 显示CPU性能情况和当前的CPU使用率 如CPU使用率过高说明计算压力较大,需要提升CPU性能或排查具体计算任务 |
内存使用率 | 显示服务器当前内存使用率 如内存过高可能会导致宕机,需要加大物理内存或中止部分占用内存较多的进程 |
磁盘可用空间 | 服务器磁盘剩余可用空间 |
磁盘读取 | 根目录磁盘的读取速率BPS,反映了磁盘读写性能消耗情况 |
磁盘写入 | 根目录磁盘的写入速率BPS,反映了磁盘读写性能消耗情况 |
下载带宽 | 服务器网络上行速率,用于判断服务器网络的压力情况 |
上传带宽 | 服务器网络下行速率,用于判断服务器网络的压力情况 |