1. 概述
本文以最简洁清晰的步骤拆解,带大家了解部署运维平台和帆软应用的流程,以及用户可使用运维平台进行的运维操作。
部署流程简介:通过finekey工具部署运维平台,通过运维平台部署/对接运维项目
2. 准备服务器
本节准备的是运维平台和帆软项目的服务器
本文介绍的是最简单的部署方案,因此对服务器配置要求较高,端口无法严格限制。
如无法提供全新服务器、网络端口限制较严格,请参考:部署运维平台、部署新项目
本文列出的配置方案,均为大部分企业用量对应的配置方案。如用量较大(例如数据量超大,管道任务超多),请参考:部署运维平台、部署新项目
2.1 基础配置
配置 | 要求 |
---|---|
操作系统 | 版本:Linux、X86_64 内核:3.10版本及以上 软件:
|
CPU | 主频:2.5GHz及以上 |
磁盘 | 类型:XFS 性能:
|
网络带宽 | 内网时延:<1ms 内网带宽:≥2.5Gbps(312.5MB/s) 外网带宽:≥100bps(12.5MB/s) 端口:服务器全新,不部署其他工程或内容,所有端口均未被占用 网络:
|
权限命令 | 1)sudo权限 优先推荐使用root超管用户进行项目部署和运行 Ubuntu 22 默认root用户不是超管,请参考文档赋权:Linux用户权限说明 2)命令 确保服务器已安装tar命令 确保服务器已安装sed命令 |
其他 | 请勿使用虚拟机 所有服务器时区一致,时间一致 |
2.2 高级配置
下表列出的磁盘,是指服务器/root/data目录所在分区剩余空闲磁盘大小,而非服务器磁盘总量。
下表列出的内存,是指服务器剩余空闲物理内存,而非服务器总内存。
本文列出的配置方案,均为大部分企业用量对应的配置方案。如用量较大(例如数据量超大,管道任务超多),请参考:部署运维平台、部署新项目
类型 | 服务器 | 数量 | CPU | 内存 | 磁盘 | 作用 |
---|---|---|---|---|---|---|
运维平台 | 运维平台服务器 | 1台 | 4核 | 16G | 200G | 部署运维平台 如对接多个项目,请根据项目日访问量增加运维平台磁盘。日访问量5w,对应100G磁盘 如部署单机FR/FDL,且服务器资源紧张,可只准备1台服务器,部署 基础版运维平台 和帆软项目 |
FineBI6.1 | 主应用服务器 | 1台 | 16核 | 64G | 500G | 部署bi业务和引擎组件 推荐自备S3,作为数据存储组件 如自备S3,作为数据存储组件bi-minio和文件存储组件minio,请至少准备两个独立bucket,分别用做两个组件内容存储 |
组件服务器 | 1台 | 4核 | 16G | 400G | 部署bi集群、日志、配置组件 | |
FineReport11 | 主应用服务器 | 1台 | 8核 | 32G | 350G | 部署fr工程、日志和配置组件 |
FineDataLink | 主应用服务器 | 1台 | 8核 | 32G | 350G | 部署fdl |
组件服务器 | 1台 | 8核 | 16G | 1.3T | 部署kafka、日志和配置组件 |
3. 部署运维平台
面向对象:部署FineOps运维平台。
本文介绍的是最简单的部署方案,因此对服务器配置要求较高,端口无法严格限制。
如无法提供全新服务器、网络端口限制较严格,请参考:部署运维平台
步骤 | 说明 | |
---|---|---|
1 | 准备服务器 | 参考第二章准备服务器 |
2 | 准备安装包 | 1)点击下载安装包:FineOps运维平台下载 中的「全量版离线安装包」 2)将安装包上传到服务器中 3)终端连接服务器,进入安装包所在目录,解压安装包:tar zxvf finekey-operation-all.tar.gz |
3 | 部署运维平台 | 1)终端连接服务器,进入解压后的finekey/bin目录 2)执行自动化部署:./finekey 3)出现 deployment success!bye~ 提示时,表示已经成功部署 |
4 | 访问运维平台 | 1)在浏览器地址栏输入:http://{ip}/ops/decision(请把{ip}换成自己的服务器IP) 2)回车,即可访问FineOps运维平台 |
4. 部署新项目(FR/BI/FDL)
面向对象:先部署好了运维平台,此时可以让运维平台帮助管理员部署并自动接入FR/BI应用。
本文介绍的是最简单的部署方案,因此对服务器配置要求较高,端口无法严格限制。
如无法提供全新服务器、网络端口限制较严格,请参考:部署新项目
步骤 | 说明 | |
---|---|---|
1 | 准备服务器 | 参考第二章准备服务器 |
2 | 部署帆软项目 | 1)管理员登录 FineOps 运维平台,点击「项目管理」,点击「部署新项目」 2)进入「项目设置」界面,设置以下信息,点击「下一步」
3)进入「节点配置」,新增主应用和组件节点 输入主机、端口、用户名密码,挂载路径无需修改 4)节点全部添加完毕后,点击「下一步」,进入「部署列表」确认界面。 由于端口全部可用,无需调整部署配置。 5)点击「开始检测」,通过环境检测后,点击「开始部署」,即可开始部署。 |
3 | 访问帆软项目 | 通过运维平台成功部署的新项目,自动接入运维平台的项目管理列表中 其中的访问地址,即为该帆软项目的访问地址,在浏览器新窗口访问该地址,即可进入工程初始化配置界面 |
5. 接入已有项目
面向对象:先部署好了FR/BI应用,后部署了运维平台。为了让运维平台管理FR/BI应用,需要让运维平台接入部署好的应用。
详情请参见:接入已有项目
步骤 | 说明 | |
---|---|---|
1 | 检查是否支持接入 | 1)运维平台和需要被管理的FR/BI应用,所在的服务器必须内网互通 2)请确保FineReport/FineBI/FineDataLink应用安装了「系统运维」插件 3)建议将运维平台与插件均升级到最新版本 4)非运维平台部署的项目,请确保应用部署在Linux/Windows系统的Tomcat中间件中 |
2 | 项目发起对接请求 | 1)获取运维平台的访问地址,形如:http://ip:port/ops/decision 2)管理员登录帆软应用,点击「管理系统>系统管理>常规」。 在「运维平台连接设置」中,输入「运维平台地址」,点击「保存」。 |
3 | 运维平台允许对接 | 1)请在五分钟内,使用管理员账号登录运维平台。运维平台提示「发现新项目」。 2)点击「添加项目」,设置「项目名称」,点击「确认」即可。 |
4 | 接入成功 | 连接成功后,在运维平台的「项目管理」中,可看到对接成功的项目。 |
6. 首次使用运维平台管理项目时需要做什么?
本节分为两类操作:
一类是管理员首次需要配置好的、让运维平台定期自动执行的操作。
一类是管理员需要手动定期为项目进行检查的一些内容。
6.1 配置自动化规则
建议操作 | 说明 |
---|---|
设置自动备份 | 应用场景: 定期自动对项目进行整体异机备份,防止工程服务器出现意外,工程文件出现损毁后有办法快速恢复 功能简介: 选择项目,在「维护>备份管理」中开启自动备份,设置备份频率 参考文档:备份管理 |
设置告警对象 | 应用场景: 运维平台监控到项目出现异常时,可以通过email、webhook、企业微信等方式通知管理员 因此管理员需要先设置好告警对象,方便运维平台知道给谁发消息 功能简介: 在「告警中心>告警通知设置」中设置告警对象,支持「email、webhook、企业微信、企业微信机器人、钉钉机器人、飞书机器人」多种方式 参考文档:告警通知设置 |
设置自动系统巡检 | 应用场景: 系统巡检,可以理解为定期为系统做体检,确保及时发现系统的问题并进行调整。 因此管理员需要设定好体检的周期,让运维平台自动定期对系统进行监控巡检。 功能简介: 选择项目,在「健康巡检>系统巡检>巡检设置」中开启系统自动检查,设置执行周期 参考文档:系统巡检 |
设置宕机处理策略 | 应用场景: 系统宕机之后: 需要第一时间进行重启,需要第一时间恢复进程,以免影响业务用户使用 需要导出宕机日志,帮助管理员事后查看和分析宕机原因和优化方案 功能简介: 选择项目,在「宕机>宕机处理策略」中开启宕机自动处理,设置宕机相关配置项 参考文档:宕机处理策略 |
6.2 定期手动检查
建议操作 | 说明 |
---|---|
检查组件状态与更新 | 应用场景: 为满足客户的新需求以及完善之前版本某些功能的不足之处,帆软产品在不断地更新迭代,管理员需要定期检查项目组件是否正常运行、是否需要更新 功能简介: 该功能仅面向容器化部署的项目 选择项目,在「维护>组件管理」中可以检查 |
检查各类监控仪表板 | 应用场景: 对于服务器、工程和工程中的组件,运维平台提供对应监控看板,监控各个指标情况 当指标出现异常时,会标黄/标红显示 功能简介: 选择项目,在「项目监控」中,可以查看各个监控看板,查看异常指标项 |
检查健康巡检异常项 | 应用场景: 运维平台会定期对FR/BI工程进行体检,管理员要根据体检报告改善工程配置 功能简介: 选择项目,在「健康巡检>系统巡检」中,根据修改建议优化工程 |
7. 项目出现异常时,运维平台可以做什么?
问题 | 解决方案 |
---|---|
应用监控与告警 | 当系统运行出现异常时,会触发系统的告警规则 当触发告警后,会通过告警方式通知管理员 管理员根据告警内容,优化问题,提前解决问题 |
宕机恢复与分析 | 当系统宕机之后 1)运维平台可根据宕机处理策略,自动重启工程,恢复进程 2)运维平台提供此次宕机的原因和处理方案,可根据方案优化 3)宕机后自动导出堆栈日志,运维平台可对日志进行分析,可根据分析报告优化 |
运维日志下载 | 出现任何问题,需要分析工程日志时,可通过运维平台快速下载日志到本地进行分析 |
配置更新与启停 | 如果检测到是FR/BI工程或组件的配置不合理,需要进行调整时: 1)对于FR/BI项目组件,可通过组件管理功能对Nginx/Redis/配置库进行配置修改 2)对于FR/BI工程,可通过「业务配置更改」功能修改工程配置,确保工程平稳运行 |