1. 概述
1.1 版本
运维平台版本 | 功能变更 |
---|---|
V1.5.9 | - |
V1.6.0 | 1)新增支持查看组件拓扑结构 2)调整展示顺序,近1h健康指标位置向上调整 |
V2.0.0 | 交互优化,功能入口位置调整 |
1.2 功能简介
对于接入的运维项目,FineOps运维平台为管理员提供多角度监控和各类运维操作。
对于每个项目,运维平台提炼出用户最关心的信息和最常用的操作,组合成了「项目总览」界面。
管理员登录运维平台,点击「项目管理」,选择运维项目,即可进入该项目的项目总览界面。
3. 项目信息
支持展示的信息如下图所示:
内容 | 具体说明 |
---|---|
主应用 | 运维项目中主应用的类型 包括:fr、bi、fdl |
应用状态 | 运维项目中是否存在存活节点 包括:可用、不可用 |
应用版本 | 运维项目中主应用的版本 精确到小版本号,例如11.0.15 |
存活节点占比 | 运维平台部署的项目,展示应用节点总数及存活的节点数 非运维平台部署的项目,只显示存活节点数,不显示节点总数 |
4. 近1h健康指标
4.1 信息一览
支持展示的信息如下图所示:
内容 | 具体说明 | 展示前提 |
---|---|---|
告警数量 | 近1小时当前项目触发的告警数量 | 运维平台的「grafana、prometheus、alertmanager」组件必须启用,方可正常展示 |
综合健康指数 | 近1小时系统健康程度的综合指标 综合健康得分=(满意请求数+可容忍请求数/2)/总请求数)*100% 满意请求:耗时<3s且成功的请求 可容忍请求:3s<=耗时<12s、且成功的请求 | 运维平台的「elasticSearch、skywalking_oap」组件已启用 运维项目使用JDK8u211及以上版本 运维项目中系统运维插件版本为1.4.9及以上 FineBI版本为6.0.9及以上 |
并发用户峰值 | 近1小时中使用请求切片去计算每分钟的并发用户数峰值 |
4.2 系统健康观测
点击「近1h健康指标」,可跳转至该运维项目的「项目监控>健康观测」界面,查看详细的系统健康指标。
详情请参见:健康观测
5. 用量
5.1 信息一览
支持展示的信息如下图所示:
内容 | 具体说明 | 展示前提 |
---|---|---|
运行中容器数 | 展示各种组件的容器总数和运行中容器数 | 仅支持展示运维平台部署的组件 因此非运维平台部署的运维项目,可能没有组件,显示为0 |
已分配CPU | 展示所有容器已分配CPU量之和、所有容器CPU总量之和 已分配CPU:所有容器已分配CPU量之和,如果存在任何容器未限制CPU,则显示「--」 CPU总量:各种容器CPU总量之和 | 运维平台部署的项目支持展示 非运维平台部署的项目不限制分配CPU,显示「--」 |
已分配内存 | 展示所有容器已分配内存量之和、所有容器内存总量之和 已分配内存:所有容器已分配内存量之和,如果存在任何容器未限制内存,则显示「--」 内存总量:各种容器内存总量之和 | 运维平台部署的项目支持展示 非运维平台部署的项目显示各节点堆内内存+堆外内存之和 |
在部署运维项目时,会自动给每个组件设置可占用的CPU/内存上限。此处显示的已分配CPU/内存,是各个组件的分配值的总和。
但各组件不会同时满负荷运行,为了防止资源过剩,因此分配的总和可能会超出服务器实际的资源值。
如果觉得不合理,可对运维项目进行「系统巡检」,判断是否需要修改,或直接参考下一节调整分配。
5.2 分配CPU/分配内存
仅运维平台部署的项目支持本节操作。
应用场景:
1)在「已分配CPU」指标下,出现黄色警告,悬浮提示「该项目已分配的CPU为xCore,存在x个组件CPU未设限,请于组件管理进行设置」,说明存在组件CPU未设限。
2)在「已分配内存」指标下,出现黄色警告,悬浮提示「该项目已分配的内存为xGB,存在x个组件内存未设限,请于组件管理进行设置」,说明存在组件内存未设限。
3)「已分配CPU」和「已分配内存」指标中,限制值飘红,说明限制值超过可用值,分配不合理,应当修改。
操作步骤:
1)直接点击「去设置」按钮,或点击「运维管理>项目>维护>组件管理」。
2)在各个组件的「更改配置」中,可设置/修改CPU和内存上限,点击「确定」生效。
6. 组件-列表
6.1 信息一览
列表视图下,支持展示的组件信息如下图所示:
内容 | 具体说明 | 展示前提 |
---|---|---|
列表-组件名称 | 容器化部署的各种组件类型,以及各类组件所在服务器IP | 仅支持展示运维平台部署的组件 因此非运维平台部署的运维项目,可能没有组件,显示为空 |
列表-组件状态 | 容器化部署的各种组件的运行节点占比,以及各个组件运行状态 包括:运行、停止 | |
列表-操作 | 支持对容器化部署的各种组件进行操作 包括:启动、重启、停止 |
6.2 组件启停
仅运维平台部署的项目支持本节操作。
1)支持对fr、bi、fdl组件单个/整体启动、重启、停止。
2)支持对未启动的MySQL、Redis组件启动,不支持对已启动的MySQL、Redis进行任何操作。
3)支持对其他组件整体启动、重启、停止。
6.3 组件管理
点击「组件」,可跳转至「运维管理>项目管理>组件管理」界面,支持对组件进行管理操作。
详情请参见:组件管理
7. 组件-拓扑
组件拓扑主要应用于集群项目:
帮助管理员查看每个节点和集群组件是否连接联通。
帮助管理员检查工程节点数是否与计划数量一致。
帮助管理员查看每个组件占用的服务器和端口是否与计划一致。
7.1 信息一览
展示各类组件之间的结构拓扑关系。
椭圆:代表单类组件,展示组件名称。点击可展开为此类组件下的多个容器。
圆圈:代表单个容器,展示容器的IP和端口。
连线:代表组件/容器之间存在依赖关系。若连线飘红,代表服务无法连通。
7.2 组件详情
1)选中拓扑图中的组件,点击「查看详情」。
2)可查看组件详情。
信息 | 说明 |
---|---|
组件名称 | 展示组件名称 |
已运行容器占比 | 此类组件下已运行容器数量/总容器数量 |
容器运行状态 | 此类组件下各个容器的运行状态 包括:运行、停止 |
容器IP | 此类组件下各个容器所在服务器IP |
容器端口 | 此类组件下各个容器所占服务器端口 |
展示高级信息 | 仅FineBI项目支持展示高级信息,其他类型项目勾选无作用。 勾选该按钮后,展示各个容器的: id、name、ip、httpPort、grpcPort、syncType、dbPath、timestamp |
7.3 查看流量关系
点击「查看流量关系」,可跳转至「项目监控>流量监控」界面,支持查看组件间的流量关系。
详情请参见:流量监控