1. 概述
企业在管理帆软应用(FineReport、FineBI)的过程中,常常会遇到一些痛点和挑战:
1)低效的运维流程:应用管理员运维经验不足,专业运维人员又无法深入解决应用问题,传统运维流程耗时耗力,导致企业运维效率低下,影响业务的正常运转。
2)不足的监控手段:运维人员可能无法准确监控项目的性能和可用性,缺乏运维过程中必要的工具和技术。
3)多项目管理混乱:企业可能有多个项目运行,而这些项目由不同的部门或团队负责管理,导致版本不统一、部署环境各异,难以进行统一的运维管理。
因此帆软推出「运维平台」工具,帮助企业更好地解决以上问题。
2. 功能定位
运维平台是保障帆软应用稳定运行和全方位运维管理的工具。
通过自动化、集中化和可视化等方式,提高系统稳定性和可用性,降低项目管理成本,加快故障排查和问题解决速度,为企业提供了一套完整的运维解决方案。
导航 | 说明 |
---|---|
官网指引 | 用户可前往官网了解FineOps运维平台更多应用场景和相关资料 |
下载安装 | 用户可前往下载页,获取FineOps运维平台安装包,在本地进行安装试用 安装步骤请参见:部署运维平台 |
Demo展示 | 用户可前往Demo平台,使用帆软通行证登录,查看FineOps运维平台功能 出于安全考虑,该Demo演示系统屏蔽了部分功能,如需体验运维平台全功能,建议下载安装试用。 |
问题反馈 | 如出现使用问题,付费用户请联系技术支持 技术支持联系方式:前往「服务」,选择「在线支持」、电话「400-811-8890」 |
3. 功能架构
运维平台是基于多种开源工具和组件构建的监控和管理系统,包括 prometheus、skywalking、grafana 等,共同协作帮助运维人员轻松地监控、管理和优化帆软应用。
运维矩阵:
技术架构:
4. 主要特点
特点 | 简介 |
---|---|
自动部署对接应用 | 支持快速部署 FineReport/FineBI/FineDataLink单机、集群及所需的组件 基于部署环境配置好内存、CPU、环境变量以及环境参数,保证部署后工程处于最佳状态 |
集中项目健康管理 | 综合衡量项目系统性能指标,采用国际通用的Apdex标准化指标来衡量系统性能状态,将用户实际体验,以数据形式准确展示出来 |
快速排查故障问题 | 当出现项目不可用、无响应时,可使用运维平台快速排查原因,并及时恢复系统使用 基于宕机前的预防、宕机时的采集、采集后的恢复、恢复后的分析,实现宕机处理闭环 |
快速定位性能问题 | 当业务人员查看报表/仪表板卡顿、慢等体验不佳状况时可使用运维平台快速定位问题 |
可视化操作管理 | 对容器化项目、组件提供界面化修改配置文件和启停,减少人为操作错误的发生,从而使项目更加趋于健康稳定运行 |
5. 场景优势
注:下表列出的所有场景,均面向在Linux系统上部署的帆软应用。
帆软推荐用户使用 Linux 系统服务器部署正式工程,原因请参见:Linux系统优势
项目生命周期 | 非运维平台部署 | 运维平台+非运维平台部署 | 运维平台+运维平台部署 | |
---|---|---|---|---|
部署阶段 | 环境准备 | ✖ 部署环境不检测 多工程环境不隔离 | ✖ 部署环境不检测 多工程环境不隔离 | ✔ 部署环境强检测 组件环境完全隔离 |
部署项目 | ✖ 自行部署集群组件 自行准备配置库 后台手动部署工程 自行对接集群和配置组件 自行优化工程配置 | ✖ 自行部署集群组件 自行准备配置库 后台手动部署工程 自行对接集群和配置组件 自行优化工程配置 | ✔ 一键部署工程+配置库+集群组件+运维组件 支持对接自备高可用组件 支持界面化调整端口配置 自动优化组件内存等配置 | |
注册授权 | ✔ 根据环境判断选择注册方式 部分注册方式需要服务器后台操作 | ✔ 根据环境判断选择注册方式 部分注册方式需要服务器后台操作 | ✔ 单一注册方式,全方位适配 界面上传注册,无需运维技术 | |
运行监控 | 资源监控 | ✖ 不支持 | ✔ 支持监控Linux服务器 磁盘 网络 CPU 内存 ✖ 不支持监控Windows | ✔ 支持监控服务器 磁盘 网络 CPU 内存 |
应用监控 | ✔ 磁盘 网络 CPU 内存 负载 监控时间短,不支持回溯 | ✔ 磁盘 网络 CPU 内存 负载 线程池 GC状态 BI资源监控 支持回溯历史时间资源状态 | ✔ 磁盘 网络 CPU 内存 负载 线程池 GC状态 BI资源监控 支持回溯历史时间资源状态 | |
组件监控 | ✖ 不支持 | ✔ 监控MySQL配置库 监控ES日志服务 监控Nginx内网关 监控Redis状态服务 监控MinIO文件服务 监控BI加速引擎 监控kafka管道服务 | ✔ 监控MySQL配置库 监控ES日志服务 监控Nginx内网关 监控Redis状态服务 监控MinIO文件服务 监控BI加速引擎 监控kafka管道服务 | |
系统巡检 | ✔ 巡检插件 | ✔ 巡检 | ✔ 巡检 容器化标准环境(新版本出现环境要求变化时,更新自动优化) | |
异常处理 | 性能定位 | ✖ 需要被动的等待用户反馈问题 无法衡量和定位问题 需要拿日志自行分析 | ✔ 系统健康观测,主动发现系统卡慢 链路追踪,进一步问题定位,精确到网络波动、数据库性能、配置库、复杂资源、资源不足等问题 | ✔ 系统健康观测,主动发现系统卡慢 链路追踪,进一步问题定位,精确到网络波动、数据库性能、配置库、复杂资源、资源不足等问题 |
异常告警 | ✔ 负载异常预警 磁盘空间预警 | ✔ 负载异常预警 磁盘空间预警 宕机提醒预警 集群组件状态异常预警 线程阻塞预警 打开文件数过多预警 自定义预警 | ✔ 负载异常预警 磁盘空间预警 宕机提醒预警 集群组件状态异常预警 线程阻塞预警 打开文件数过多预警 自定义预警 | |
故障处理 | ✔ 支持宕机自动恢复 进程消失自动恢复覆盖范围优先 | ✔Linux 支持宕机自动恢复 进程消失自动恢复覆盖范围优先 ✖Windows 不支持通过运维平台对Windows服务器中工程实现宕机自动恢复 但可依赖工程数据决策系统的宕机自动恢复功能 | ✔ 支持宕机自动恢复 支持进程消失自动恢复 | |
故障分析 | ✖ 需要获取日志人工分析 | ✔ 支持自动分析堆栈及gc日志 | ✔ 支持自动分析堆栈及gc日志 | |
日志下载 | ✖ 需要服务器后台操作 | ✔ 前端按日期按类型下载日志 前端触发生成堆栈等日志 | ✔ 前端按日期按类型下载日志 前端触发生成堆栈等日志 | |
终端对接 | ✖ 需要服务器后台操作 | ✖ 需要服务器后台操作 | ✔ 支持前端webshell至容器内执行命令 | |
项目运维 | 项目启停 | ✖ 需要服务器后台操作 | ✖ 需要服务器后台操作 | ✔ 运维平台前端界面化操作 支持启停应用及集群组件 |
更新升级 | ✔ 服务器后台操作换JAR | ✔ 服务器后台操作换JAR | ✔ 运维平台远程一键更新升级 配套升级项目其他组件 | |
备份还原 | ✖ 需要自行手动异地备份 平台可备份工程部分关键内容 需手动还原 | ✔ 支持备份工程到运维平台所在机器 不支持备份集群组件 需手动还原 | ✔ 支持备份工程到运维平台所在机器 支持备份容器化部署的集群组件 支持前端整体还原备份内容 | |
文件管理 | ✖ 需要服务器后台操作 | ✔ 运维平台前端界面化操作 支持上传、下载、查看文件 | ✔ 运维平台前端界面化操作 支持上传、下载、查看文件 | |
SSL配置 | ✖ 需要服务器后台操作 | ✖ 需要服务器后台操作 | ✔ 运维平台前端界面化上传即可 | |
集群扩容 | ✖ 需要服务器后台操作 | ✖ 需要服务器后台操作 | ✔ 运维平台前端界面化新增节点 | |
业务管理 | 资源隔离 | ✖ 不支持 | ✔ 集群内不同节点服务于不同用户 集群内不同节点服务于不同业务模板 | ✔ 集群内不同节点服务于不同用户 集群内不同节点服务于不同业务模板 |
资源优先级 | ✖ 不支持 | ✔ 支持定义高优先级资源,资源紧张时优先保障 | ✔ 支持定义高优先级资源,资源紧张时优先保障 |