1. 概述
企业在管理帆软应用(FineReport、FineBI)的过程中,常常会遇到一些痛点和挑战:
1)低效的运维流程:应用管理员运维经验不足,专业运维人员又无法深入解决应用问题,传统运维流程耗时耗力,导致企业运维效率低下,影响业务的正常运转。
2)不足的监控手段:运维人员可能无法准确监控项目的性能和可用性,缺乏运维过程中必要的工具和技术。
3)多项目管理混乱:企业可能有多个项目运行,而这些项目由不同的部门或团队负责管理,导致版本不统一、部署环境各异,难以进行统一的运维管理。
因此帆软推出「运维平台」工具,帮助企业更好地解决以上问题。
2. 功能定位
运维平台是保障帆软应用稳定运行和全方位运维管理的工具。
通过自动化、集中化和可视化等方式,提高系统稳定性和可用性,降低项目管理成本,加快故障排查和问题解决速度,为企业提供了一套完整的运维解决方案。
导航 | 说明 |
---|---|
官网指引 | 用户可前往官网了解FineOps运维平台更多应用场景和相关资料 |
下载安装 | 用户可前往下载页,获取FineOps运维平台安装包,在本地进行安装试用 安装步骤请参见:部署运维平台 |
Demo展示 | 用户可前往Demo平台,使用帆软通行证登录,查看FineOps运维平台功能 出于安全考虑,该Demo演示系统屏蔽了部分功能,如需体验运维平台全功能,建议下载安装试用。 |
问题反馈 | 如出现使用问题,付费用户请联系技术支持 技术支持联系方式:前往「服务」,选择「在线支持」、电话「400-811-8890」 |
3. 功能架构
运维平台是基于多种开源工具和组件构建的监控和管理系统,包括 prometheus、skywalking、grafana 等,共同协作帮助运维人员轻松地监控、管理和优化帆软应用。
运维矩阵:
技术架构:
4. 主要特点
特点 | 简介 |
---|---|
自动部署对接应用 | 支持快速部署 FineReport/FineBI/FineDataLink单机、集群及所需的组件 基于部署环境配置好内存、CPU、环境变量以及环境参数,保证部署后工程处于最佳状态 |
集中项目健康管理 | 综合衡量项目系统性能指标,采用国际通用的Apdex标准化指标来衡量系统性能状态,将用户实际体验,以数据形式准确展示出来 |
快速排查故障问题 | 当出现项目不可用、无响应时,可使用运维平台快速排查原因,并及时恢复系统使用 基于宕机前的预防、宕机时的采集、采集后的恢复、恢复后的分析,实现宕机处理闭环 |
快速定位性能问题 | 当业务人员查看报表/仪表板卡顿、慢等体验不佳状况时可使用运维平台快速定位问题 |
可视化操作管理 | 对容器化项目、组件提供界面化修改配置文件和启停,减少人为操作错误的发生,从而使项目更加趋于健康稳定运行 |
5. 场景优势
注:下表列出的所有场景,均面向在Linux系统上部署的帆软应用。
帆软推荐用户使用Linux系统服务器部署正式工程,原因请参见:Linux和Windows对比分析
场景 | 非容器化部署 | 运维平台+非容器化部署 | 运维平台+容器化部署 | 功能导航 | |
---|---|---|---|---|---|
监控 | 服务器资源监控 | ✖ | ✔ 支持监控Linux服务器磁盘、网络、CPU、内存等资源状态 ✖ 不支持监控Windows服务器 | ✔ 支持监控服务器磁盘、网络、CPU、内存等资源状态 | |
应用状态监控 | ✔ 1. 内存 2. CPU 3. 磁盘 4. 负载 5. 监控时间短,不支持回溯 | ✔ 1. 内存 2. CPU 3. 磁盘 4. 负载 5. 线程池 6. gc状态 7. BI资源监控 8. 支持回溯历史时间资源状态 | ✔ 1. 内存 2. CPU 3. 磁盘 4. 负载 5. 线程池 6. gc状态 7. BI资源监控 8. 支持回溯历史时间资源状态 | ||
运行组件监控 | ✖ | ✔ 集群组件 1. 配置数据库监控:MySQL 2. 状态服务器监控:Redis 3. 负载均衡监控:Nginx 4. 文件服务监控:MinIO | ✔ 集群组件 1. 配置数据库监控:MySQL 2. 状态服务器监控:Redis 3. 负载均衡监控:Nginx 4. 文件服务监控:MinIO | ||
告警 | 异常告警 | ✔ 1. 负载异常预警 2. 磁盘空间预警 | ✔ 1. 负载异常预警 2. 磁盘空间预警 3. 宕机提醒预警 4. 集群组件状态异常预警 5. 线程阻塞预警 6. 打开文件数过多预警 7. 自定义预警 | ✔ 1. 负载异常预警 2. 磁盘空间预警 3. 宕机提醒预警 4. 集群组件状态异常预警 5. 线程阻塞预警 6. 打开文件数过多预警 7. 自定义预警 | |
日常运维 | 应用启停 | ✖ 需要上服务器后台操作 | ✖ 需要上服务器后台操作 | ✔ 运维平台前端界面化操作 启停应用及集群组件 | 组件管理 |
配置更改 | ✖ 需要上服务器后台操作 | ✖ 需要上服务器后台操作 | ✔ 运维平台前端界面化操作 1. 限制应用及集群组件资源 2. 修改组件配置 | ||
文件管理 | ✖ 需要上服务器后台操作 | ✔ 运维平台前端界面化操作 查看、上传、下载文件 | ✔ 运维平台前端界面化操作 查看、上传、下载文件 | 文件管理 | |
更新升级 (小版本) | ✔ 1. 服务器后台操作换JAR 2. 数据决策系统在线更新升级 | ✔ 1. 服务器后台操作换JAR 2. 数据决策系统在线更新升级 | ✔ 运维平台远程一键更新升级 | ||
异地备份还原 | ✖ 需要自行手动实现异地备份还原 | ✔ 1. 备份至运维平台所在机器 2. 不支持集群组件备份 3. 需手动还原 | ✔ 1. 备份至运维平台所在机器 2. 支持运维平台部署的集群组件整体备份,自己部署的集群组件需要自行处理 3. 支持集群整体还原,自己部署的集群组件需要自行处理 | 备份管理 | |
环境巡检 | ✔ 巡检插件 | ✔ 巡检 | ✔ 1. 巡检 2. 容器化标准环境(包括环境要求变化时容器化更新自动覆盖) | 健康巡检 | |
日志获取 | ✔ 前端获取 | ✔ 1. 前端获取 2. 前端触发生成堆栈等日志 | ✔ 1. 前端获取 2. 前端触发生成堆栈等日志 | 日志下载 | |
webshell 命令行执行 | ✖ 需要上服务器后台操作 | ✖ 需要上服务器后台操作 | ✔ 支持前端webshell至容器内执行命令 | 组件管理 | |
故障处理 | 自动恢复 | ✔ 1. 支持宕机自动恢复 2. 进程消失自动恢复覆盖范围优先 | ✔ 支持Linux服务器中工程: 1. 宕机自动恢复 2. 进程消失自动恢复覆盖范围优先 ✖ 不支持通过运维平台对Windows服务器中工程实现宕机自动恢复 但可依赖工程数据决策系统的宕机自动恢复功能 | ✔ 1. 支持宕机自动恢复 2. 支持进程消失自动恢复 | |
故障分析 | ✖ 需要获取日志文件人工分析 | ✔ 支持自动分析堆栈及gc日志 | ✔ 支持自动分析堆栈及gc日志 | 日志分析 | |
部署 | 应用部署 | ✖ | ✖ | ✔ 1. 支持直接界面部署容器化应用FR、BI,配置端口 2. 支持部署Redis、Nginx、MinIO等集群服务组件 | 部署新项目 |
其他 | 资源优先级 | ✖ | ✔ 支持定义高优先级资源,资源紧张时优先保障 | ✔ 支持定义高优先级资源,资源紧张时优先保障 | 资源优先级管理 |
对接多项目 | ✖ | ✔ 支持对接多个项目 | ✔ 支持对接多个项目 | 项目管理 | |
实验性功能 | 资源隔离 | ✖ | ✔ 1. 支持实现集群内不同节点服务于不同用户 2. 支持实现集群内不同节点服务于不同业务模板 | ✔ 1. 支持实现集群内不同节点服务于不同用户 2. 支持实现集群内不同节点服务于不同业务模板 | 资源隔离管理 |
链路追踪 | ✖ | ✔ 1. 支持通过链路追踪监控应用访问性能 2. 支持查询并分析链路 | ✔ 1. 支持通过链路追踪监控应用访问性能 2. 支持查询并分析链路 |