1. 概述
1.1 版本
| 运维平台版本 | 功能变更 |
|---|---|
| V1.5.9 | - |
| V1.6.0 | 新增支持查看组件拓扑结构 调整展示顺序,近 1h 健康指标位置向上调整 |
| V2.0.0 | 交互优化,功能入口位置调整 |
| V2.20.0 | 优化 CPU 和内存用量的颜色和提示,帮助用户理解资源超额分配场景的合理性 |
1.2 功能简介
对于已接入的运维项目,运维平台为管理员提供多角度监控和各类运维操作。
运维平台从每个项目中提炼出用户最关心的信息和最常用的操作,整合为「项目总览」界面,方便管理员快速掌握项目整体状态。
进入路径: 登录运维平台 > 点击「项目管理」 > 选择运维项目,即可进入该项目的项目总览界面。

2. 项目信息
项目总览界面展示以下项目基本信息:

| 内容 | 具体说明 |
|---|---|
| 主应用 | 运维项目中主应用的类型,包括 FineBI、FineReport、FineDataLink |
| 应用状态 | 运维项目中是否存在存活节点,包括:可用、不可用 |
| 应用版本 | 运维项目中主应用的版本,精确到小版本号,例如 11.5.1 |
| 存活节点占比 | 运维平台部署的项目展示应用节点总数及存活节点数 非运维平台部署的项目仅显示存活节点数,不显示节点总数 |
3. 近1h健康指标
3.1 信息一览
近 1h 健康指标展示以下信息:

| 内容 | 具体说明 | 展示前提 |
|---|---|---|
| 告警数量 | 近 1 小时内当前项目触发的告警数量 | 运维平台的 grafana、prometheus、alertmanager 组件已启用 |
| 综合健康指数 | 用于表示系统健康程度的综合指标,建议保持在 95% 以上 综合健康指数 =(满意请求数 + 可容忍请求数 / 2)/ 总请求数 × 100%
|
|
| 并发用户峰值 | 近 1 小时内,使用请求切片计算每分钟并发用户数的峰值 |
3.2 跳转系统健康观测
点击「近 1h 健康指标」区域,可跳转至该运维项目的「项目监控 > 健康观测」界面,查看详细的系统健康指标。
详情请参见:系统健康观测

4. 用量
4.1 信息一览
用量模块展示以下信息:

| 内容 | 具体说明 | 展示前提 |
|---|---|---|
| 运行中容器数 | 展示各类组件的容器总数和运行中容器数 | 仅支持展示运维平台部署的组件 非运维平台部署的运维项目可能没有组件,显示为 0 |
| 已分配CPU | 展示所有容器已分配 CPU 量之和与服务器 CPU 实际量
颜色说明:
注:通常分配不超过 200% 的 CPU 总核心数均为正常范围,如超过 200% 或服务器监控中 CPU 用量明显过高,请及时调整至合理范围,避免影响性能 | 仅运维平台部署的项目支持展示 非运维平台部署的项目不限制分配 CPU,显示「--」 |
| 已分配内存 | 展示所有容器已分配内存量之和与服务器内存实际量
颜色说明:
注:通常分配不超过 120% 的内存均为正常范围,如超过 120% 或服务器监控中内存用量明显过高,请及时调整至合理范围,避免出现宕机 | 运维平台部署的项目展示已分配内存 非运维平台部署的项目展示各节点堆内内存与堆外内存之和 |
为什么已分配 CPU/内存会大于服务器现有 CPU/内存?
部署运维项目时,系统会自动为每个组件设置可占用的 CPU/内存上限,「已分配 CPU/内存」显示的是各组件分配值的总和。
由于各组件不会同时满负荷运行,为避免资源浪费,分配总和可能超出服务器实际资源值。
如认为当前分配不合理,可对运维项目执行「系统巡检」进行评估,或参考下一节直接调整分配。
4.2 分配CPU/分配内存
注:本节操作仅适用于运维平台部署的项目。
在以下场景中,需要调整 CPU 或内存的分配:
「已分配 CPU」指标下出现黄色警告,悬浮提示「该项目已分配的 CPU 为 x Core,存在 x 个组件 CPU 未设限,请于组件管理进行设置」,说明存在组件 CPU 未设限。
「已分配内存」指标下出现黄色警告,悬浮提示「该项目已分配的内存为 x GB,存在 x 个组件内存未设限,请于组件管理进行设置」,说明存在组件内存未设限。
「已分配 CPU」或「已分配内存」指标中限制值飘红,说明限制值超过可用值,分配不合理,需要修改。
操作步骤:
1)点击「去设置」按钮,或进入「项目管理 > 维护 > 组件管理」。
2)在各个组件的「更改配置」中,设置或修改 CPU 和内存上限,点击「确定」生效。

5. 组件-列表
5.1 信息一览
列表视图下,展示以下组件信息:

| 内容 | 具体说明 | 展示前提 |
|---|---|---|
| 组件名称 | 运维平台部署的各类组件类型,以及各类组件所在服务器 IP | 仅展示运维平台部署的组件 非运维平台部署的运维项目可能没有组件,显示为空 |
| 组件状态 | 运维平台部署的各组件的运行节点及运行状态 包括:运行、停止 | |
| 操作 | 支持对运维平台部署的单个组件下的全部容器进行全量操作,包括停止全部、重启全部 支持对运维平台部署的单个容器进行操作,包括启动、停止、重启 |
5.2 组件启停
注:本节操作仅适用于运维平台部署的项目。
支持对运维平台部署的单个组件下的全部容器进行全量操作,包括:停止全部、重启全部。
支持对运维平台部署的单个容器进行操作,包括:启动、停止、重启。

5.3 组件管理
点击「组件」,可跳转至「项目管理>维护>组件管理」界面,对组件进行管理操作。
详情请参见:组件管理

6. 组件-拓扑
组件拓扑主要应用于集群项目,帮助管理员完成以下查看:
查看每个节点和集群组件是否连接联通。
检查工程节点数是否与计划数量一致。
查看每个组件占用的服务器和端口是否与计划一致。
6.1 信息一览
拓扑图展示各类组件之间的结构拓扑关系,图例说明如下:
椭圆:代表单类组件,展示组件名称。点击可展开为此类组件下的多个容器
圆圈:代表单个容器,展示容器的 IP 和端口

连线:代表组件或容器之间存在依赖关系。若连线飘红,表示服务无法连通

6.2 组件详情
1)在拓扑图中选中目标组件,点击「查看详情」。
2)在组件详情面板中,可查看以下信息:

| 信息 | 说明 |
|---|---|
| 组件名称 | 展示组件名称 |
| 已运行容器占比 | 此类组件下已运行容器数量 / 总容器数量 |
| 容器运行状态 | 此类组件下各个容器的运行状态 包括:运行、停止 |
| 容器IP | 此类组件下各个容器所在服务器 IP |
| 容器端口 | 此类组件下各个容器所占服务器端口 |
| 展示高级信息 | 仅 FineBI 项目支持展示高级信息,其他类型项目勾选无效果 勾选后展示各容器的 id、name、ip、httpPort、grpcPort、syncType、dbPath、timestamp
|
6.3 查看流量关系
点击「查看流量关系」,可跳转至「项目管理 > 项目监控 > 流量监控」界面,查看组件间的流量关系。
详情请参见:流量监控

