1. 概述编辑
本文以最简洁清晰的步骤拆解,带大家了解部署运维平台和帆软应用的流程,以及用户可使用运维平台进行的运维操作。
2. 部署运维平台编辑
面向对象:部署FineOps运维平台。
本文介绍的是最简单的部署方案,因此对服务器相关要求较高,如需了解详细方案,请参考:部署运维平台
步骤 | 说明 | |
---|---|---|
1 | 准备服务器 | 1)准备一台全新服务器,该服务器不部署其他工程或内容,所有端口均未被占用 2)系统版本:CentOS 7.3~7.9 版本 / Ubuntu 18.04.4 及以上版本/ redhat 7.6 及以上版本 3)系统内核:3.10及以上,最低4核 4)系统架构:X86_64 5)剩余空闲磁盘:使用命令「df -h」查询,/root/data目录所在分区剩余空闲磁盘大于 200 G 6)剩余空闲物理内存:16G以上,最低12G 7)网络要求:对外开放80端口,确保用户可通过80端口访问运维平台 8)用户:使用root用户完成部署 |
2 | 准备安装包 |
1)点击下载安装包:FineOps运维平台下载 中的「全量版离线安装包」 外网:在线版安装包 2)将安装包上传到服务器中 3)终端连接服务器,进入安装包所在目录,解压安装包:tar zxvf finekey-operation-all.tar.gz
1)点击下载安装包:FineOps运维平台下载 中的「在线版安装包」 2)将安装包上传到服务器中 3)终端连接服务器,进入安装包所在目录,解压安装包:tar -xvf finekey-operation-online.tar |
3 | 部署运维平台 | 1)终端连接服务器,进入解压后的finekey/bin目录 2)执行自动化部署:./finekey 3)出现 deployment success!bye~ 提示时,表示已经成功部署 |
4 | 访问运维平台 | 1)在浏览器地址栏输入:http://{ip}/ops/decision(请把{ip}换成自己的服务器IP) 2)回车,即可访问FineOps运维平台 |
3. 部署新帆软项目(FR/BI/FDL)编辑
面向对象:先部署好了运维平台,此时可以让运维平台帮助管理员部署并自动接入FR/BI应用。
本文介绍的是最简单的部署方案,因此对服务器相关要求较高,如需了解详细方案,请参考:部署新项目
步骤 | 说明 | |
---|---|---|
1 | 准备服务器 | 单机 1)准备1台全新服务器,服务器不部署其他工程或内容,所有端口均未被占用 2)系统版本:CentOS 7.3~7.9 版本 / Ubuntu 18.04.4 及以上版本/ redhat 7.6 及以上版本 3)系统内核:3.10及以上,fr/bi最低8核,fdl最低4核 4)系统架构:X86_64 5)剩余空闲磁盘:使用命令「df -h」查询,服务器/root/data目录所在分区剩余空闲磁盘大于:fr/fdl 50 G,bi 100G 6)剩余空闲物理内存:fr 16G 以上、bi 32G以上、fdl 8G 以上 7)网络要求:
8)用户:使用root用户完成部署 集群 1)按照「工程节点数+1」准备全新服务器数量,服务器不部署其他工程或内容,所有端口均未被占用 2)系统版本:CentOS 7.3~7.9 版本 / Ubuntu 18.04.4 及以上版本/ redhat 7.6 及以上版本 3)系统内核:3.10及以上,frbi最低8核,fdl最低4核,集群组件服务器最低4核 4)系统架构:X86_64 5)剩余空闲磁盘:使用命令「df -h」查询,每台服务器/root/data目录所在分区剩余空闲磁盘大于:
6)剩余空闲物理内存: fr 16G 以上、bi 32G以上、fdl 8G 以上、集群组件服务器 8G 以上 7)网络要求:
8)用户:使用root用户完成部署 FDL额外: 联系帆软技术支持,获取FineDataLink、Kafka相关镜像包 |
2 | 部署帆软项目 | 1)管理员登录 FineOps 运维平台,点击「运维管理>项目管理」,点击「部署新项目」 2)进入「项目设置」界面,设置以下信息,点击「下一步」 自定义项目名称、选择应用类型、全选自定义部署组件、其他无需变更 3)进入「节点配置」 单机新增1个主应用节点,集群按照工程数量新增主应用节点和1个组件节点。 输入主机、端口、用户名密码,挂载路径无需修改。 4)点击「开始部署」,进入部署过程。 |
3 | 访问帆软项目 | 通过运维平台成功部署的新项目,自动接入运维平台的项目管理列表中 其中的访问地址,即为该帆软项目的访问地址,在浏览器新窗口访问该地址,即可进入工程初始化配置界面 |
4. 接入已有项目编辑
面向对象:先部署好了FR/BI应用,后部署了运维平台。为了让运维平台管理FR/BI应用,需要让运维平台接入部署好的应用。
由于容器化部署和非容器化部署的项目,在接入时的步骤不完全相同,因此第一步需要判断工程的部署方式,然后再选择不同的接入方案。
4.1 接入容器化部署的项目
详情请参见:接入已有容器化项目
步骤 | 说明 | |
---|---|---|
1 | 检查是否支持接入 | 运维平台和需要被管理的FR/BI应用,所在的服务器必须内网互通 |
2 | 准备材料 | 1)获取FR/BI应用的访问地址,形如:http://ip:port/webroot/decision 2)获取FR/BI应用的运维接口密钥 管理员登录FineReport/FineBI应用,点击「管理系统>智能运维>健康巡检>运维工具」。设置一个运维接口密钥,点击「保存」。 |
3 | 接入已有项目 | 1)管理员登录运维平台,点击「运维管理>项目管理」,点击「接入已有项目」按钮。 2)自定义项目名称,填入第二步准备的信息。 3)点击「测试连接并保存」。 |
4 | 接入成功 | 连接成功后提示「接入项目成功」,在项目管理列表中出现新接入的项目,即代表接入成功 |
4.2 接入非容器化部署的项目
详情请参见:接入已有非容器化项目
步骤 | 说明 | ||
---|---|---|---|
1 | 检查是否支持接入 | 1)运维平台仅支持接入FineReport11.0.6/FineBI5.1.22及以上版本工程 2)运维平台和需要被管理的FR/BI应用,所在的服务器必须内网互通 3)请确保应用部署在Linux/Windows系统的Tomcat中间件中。 4)请确保FR/BI应用安装了「系统运维」插件。建议将插件升级到最新版本。 | |
2 | 项目信息设置 | 是否必要 | 必要步骤 帮助运维平台与FR/BI应用连接 |
前提准备 | 1)获取FR/BI应用的访问地址,形如:http://ip:port/webroot/decision 2)获取FR/BI应用的运维接口密钥 管理员登录FineReport/FineBI应用,点击「管理系统>智能运维>健康巡检>运维工具」。设置一个运维接口密钥,点击「保存」。 | ||
操作步骤 | 1)管理员登录运维平台,点击「运维管理>项目管理」,点击「接入已有项目」按钮。 2)自定义项目名称,填入上一步准备的信息。 3)点击「测试连接并保存」。 | ||
3 | 组件信息设置 | 是否必要 | 非必要步骤 在运维平台所在服务器安装exporter组件,为该工程的外接数据库、负载均衡、状态服务器进行日志采集 可安装的exporter组件包括:mysqld_exporter、redis_exporter、nginx_exporter 如不安装,可直接点击「跳过」进入下一步,不影响运维平台与工程的对接,但后续运维平台将无法监控这些组件的状态并进行日志采集 |
前提准备 | 1)确认FR/BI应用中是否有符合要求的外接数据库、负载均衡、状态服务器组件 如果没有这些组件,就完全可以跳过这个步骤 2)确认MySQL、Redis、Nginx组件的端口可与运维平台内网联通 3)准备Nginx组件的服务器地址、端口、SSL信息 4)为FR/BI应用安装Nginx状态监控模块 | ||
操作步骤 | 1)检查自动设置的MySQL和Redis组件信息 2)手动填写Nginx组件信息 | ||
4 | 服务器信息设置 | 是否必要 | 非必要步骤 在FR/BI应用所在服务器安装node_exporter组件,为该工程进行服务器信息采集 可以为应用的每一个节点、每一个组件所在服务器都安装一份node_exporter组件 如不安装上述组件,可直接点击「跳过」进入下一步,不影响运维平台与工程的对接,但后续运维平台将无法监控服务器状态并进行日志采集 |
前提准备 | 1)准备所有需要安装组件的节点服务器的主机IP、端口、root用户密码 2)在所有需要安装组件的节点服务器,都准备好一个目录,用于存放exporter日志 2)准备node_exporter需要占用的端口可用性 3)确保node_exporter端口可与运维平台内网联通 | ||
操作步骤 | 将上一步准备的所有服务器的相关信息填入 | ||
5 | 接入成功 | 检测以上步骤是否有问题,没问题的情况下会成功接入 在「项目管理」界面会出现新接入的FR/BI项目 |
5. 首次使用运维平台管理项目时需要做什么?编辑
本节分为两类操作:
一类是管理员首次需要配置好的、让运维平台定期自动执行的操作。
一类是管理员需要手动定期为项目进行检查的一些内容。
5.1 配置自动化规则
建议操作 | 说明 |
---|---|
设置自动备份 | 应用场景: 定期自动对项目进行整体异机备份,防止工程服务器出现意外,工程文件出现损毁后有办法快速恢复 功能简介: 在「运维管理>备份管理」中选择运维项目,开启自动备份,设置备份频率 参考文档:备份管理 |
设置告警对象 | 应用场景: 运维平台监控到项目出现异常时,可以通过email、webhook、企业微信通知管理员 因此管理员需要先设置好告警对象,方便运维平台知道给谁发消息 功能简介: 在「监控与告警>告警管理>告警通知设置」中设置告警对象,支持「email、webhook、企业微信、企业微信机器人、钉钉机器人、飞书机器人」多种方式 参考文档:告警方式 |
设置自动健康巡检 | 应用场景: 健康巡检,可以理解为定期为系统做体检,确保及时发现系统的问题并进行调整。 因此管理员需要设定好体检的周期,让运维平台自动定期对系统进行监控巡检。 功能简介: 在「业务工具>健康巡检」中开启系统自动检查,设置执行周期 参考文档:健康诊断 |
设置宕机处理策略 | 应用场景: 系统宕机之后: 需要第一时间进行重启,需要第一时间恢复进程,以免影响业务用户使用 需要导出宕机日志,帮助管理员事后查看和分析宕机原因和优化方案 功能简介: 在「业务工具>宕机自动处理>宕机处理策略」中选择运维项目,开启宕机自动处理,设置宕机相关配置项 参考文档:宕机处理策略 |
5.2 定期手动检查
建议操作 | 说明 |
---|---|
检查组件状态与更新 | 应用场景: 为满足客户的新需求以及完善之前版本某些功能的不足之处,FineReport/FineBI在不断地更新迭代,管理员需要定期检查项目组件是否正常运行、是否需要更新 功能简介: 该功能仅面向容器化部署的项目 在「运维管理>项目管理>组件管理」中可以检查 |
检查各类监控仪表板 | 应用场景: 对于服务器、工程和工程中的组件,运维平台提供对应监控看板,监控各个指标情况 当指标出现异常时,会标黄/标红显示 功能简介: 在「监控与告警」中,可以查看各个监控看板,查看异常指标项 |
检查健康巡检异常项 | 应用场景: 运维平台会定期对FR/BI工程进行体检,管理员要根据体检报告改善工程配置 功能简介: 在「业务工具>健康巡检」中,查看是否存在异常项目,根据修改建议优化工程 |
6. 项目出现异常时,运维平台可以做什么?编辑
问题 | 解决方案 |
---|---|
应用监控与告警 | 当系统运行出现异常时,会触发系统的告警规则 当触发告警后,会通过告警方式通知管理员 管理员根据告警内容,优化问题,提前解决问题 |
宕机恢复与分析 | 当系统宕机之后 1)运维平台可根据宕机处理策略,自动重启工程,恢复进程 2)运维平台提供此次宕机的原因和处理方案,可根据方案优化 3)宕机后自动导出堆栈日志,运维平台可对日志进行分析,可根据分析报告优化 |
运维日志下载 | 出现任何问题,需要分析工程日志时,可通过运维平台快速下载日志到本地进行分析 |
配置更新与启停 | 如果检测到是FR/BI工程或组件的配置不合理,需要进行调整时: 1)对于FR/BI项目组件,可通过组件管理功能对Nginx/Redis/配置库进行配置修改 2)对于FR/BI工程,可通过「业务配置更改」功能修改工程配置,确保工程平稳运行 |