1. 概述
部署好 FineBI 后,我们还需配置项目,让平台完成自动运维。对于关键项目要定期手动检查,平台出现异常项时,及时进行处理,保证平台的健康运行。
2. FineBI系统运维
本节分为两类操作:
一类是管理员首次需要配置好的、让运维平台定期自动执行的操作。
一类是管理员需要手动定期为项目进行检查的一些内容。
2.1 配置自动化规则
本节操作均在运维平台中完成。
建议操作 | 说明 |
---|---|
设置自动备份 | 应用场景: 定期自动对项目进行整体异机备份,防止工程服务器出现意外,工程文件出现损毁后有办法快速恢复 功能简介: 选择项目,在「维护>备份管理」中开启自动备份,设置备份频率 参考文档:备份管理 |
设置告警对象 | 应用场景: 运维平台监控到项目出现异常时,可以通过email、webhook、企业微信等方式通知管理员 因此管理员需要先设置好告警对象,方便运维平台知道给谁发消息 功能简介: 在「告警中心>告警通知设置」中设置告警对象,支持「email、webhook、企业微信、企业微信机器人、钉钉机器人、飞书机器人」多种方式 参考文档:告警通知设置 |
设置自动系统巡检 | 应用场景: 系统巡检,可以理解为定期为系统做体检,确保及时发现系统的问题并进行调整。 因此管理员需要设定好体检的周期,让运维平台自动定期对系统进行监控巡检。 功能简介: 选择项目,在「健康巡检>系统巡检>巡检设置」中开启系统自动检查,设置执行周期 参考文档:系统巡检 |
设置宕机处理策略 | 应用场景: 系统宕机之后: 需要第一时间进行重启,需要第一时间恢复进程,以免影响业务用户使用 需要导出宕机日志,帮助管理员事后查看和分析宕机原因和优化方案 功能简介: 选择项目,在「宕机>宕机处理策略」中开启宕机自动处理,设置宕机相关配置项 参考文档:宕机处理策略 |
2.2 定期手动检查
本节操作均在运维平台中完成。
建议操作 | 说明 |
---|---|
检查组件状态与更新 | 应用场景: 为满足客户的新需求以及完善之前版本某些功能的不足之处,帆软产品在不断地更新迭代,管理员需要定期检查项目组件是否正常运行、是否需要更新 功能简介: 选择项目,在「维护>组件管理」中可以检查 |
检查各类监控仪表板 | 应用场景: 对于服务器、工程和工程中的组件,运维平台提供对应监控看板,监控各个指标情况 当指标出现异常时,会标黄/标红显示 功能简介: 选择项目,在「项目监控」中,可以查看各个监控看板,查看异常指标项 |
检查健康巡检异常项 | 应用场景: 运维平台会定期对FR/BI工程进行体检,管理员要根据体检报告改善工程配置 功能简介: 选择项目,在「健康巡检>系统巡检」中,根据修改建议优化工程 |
3. FineBI异常处理
本节操作均在运维平台中完成。
问题 | 解决方案 |
---|---|
应用监控与告警 | 当系统运行出现异常时,会触发系统的告警规则 当触发告警后,会通过告警方式通知管理员 管理员根据告警内容,优化问题,提前解决问题 |
宕机恢复与分析 | 当系统宕机之后 1)运维平台可根据宕机处理策略,自动重启工程,恢复进程 2)运维平台提供此次宕机的原因和处理方案,可根据方案优化 3)宕机后自动导出堆栈日志,运维平台可对日志进行分析,可根据分析报告优化 |
运维日志下载 | 出现任何问题,需要分析工程日志时,可通过运维平台快速下载日志到本地进行分析 |
配置更新与启停 | 如果检测到是FR/BI工程或组件的配置不合理,需要进行调整时: 1)对于FR/BI项目组件,可通过组件管理功能对Nginx/Redis/配置库进行配置修改 2)对于FR/BI工程,可通过「业务配置更改」功能修改工程配置,确保工程平稳运行 |