最新历史版本 :平台运维 返回文档
编辑时间: 内容长度:图片数:目录数: 修改原因:

目录:

1. 概述编辑

部署好 FineBI  后,我们还需配置项目,让平台完成自动运维。对于关键项目要定期手动检查,平台出现异常项时,及时进行处理,保证平台的健康运行。

2. FineBI系统运维编辑

本节分为两类操作:

一类是管理员首次需要配置好的、让运维平台定期自动执行的操作。

一类是管理员需要手动定期为项目进行检查的一些内容。

2.1 配置自动化规则

本节操作均在运维平台中完成。

建议操作
说明
设置自动备份

应用场景:

定期自动对项目进行整体异机备份,防止工程服务器出现意外,工程文件出现损毁后有办法快速恢复

功能简介:

选择项目,在「维护>备份管理」中开启自动备份,设置备份频率

参考文档:备份管理

设置告警对象

应用场景:

运维平台监控到项目出现异常时,可以通过email、webhook、企业微信等方式通知管理员

因此管理员需要先设置好告警对象,方便运维平台知道给谁发消息

功能简介:

在「告警中心>告警通知设置」中设置告警对象,支持「email、webhook、企业微信、企业微信机器人、钉钉机器人、飞书机器人」多种方式

参考文档:告警通知设置

设置自动系统巡检

应用场景:

系统巡检,可以理解为定期为系统做体检,确保及时发现系统的问题并进行调整。

因此管理员需要设定好体检的周期,让运维平台自动定期对系统进行监控巡检。

功能简介:

选择项目,「健康巡检>系统巡检>巡检设置」中开启系统自动检查,设置执行周期

参考文档:系统巡检

设置宕机处理策略

应用场景:

系统宕机之后:

需要第一时间进行重启,需要第一时间恢复进程,以免影响业务用户使用

需要导出宕机日志,帮助管理员事后查看和分析宕机原因和优化方案

功能简介:

选择项目,在「宕机>宕机处理策略」中开启宕机自动处理,设置宕机相关配置项

参考文档:宕机处理策略

2.2 定期手动检查

本节操作均在运维平台中完成。

建议操作
说明
检查组件状态与更新应用场景:

为满足客户的新需求以及完善之前版本某些功能的不足之处,帆软产品在不断地更新迭代,管理员需要定期检查项目组件是否正常运行、是否需要更新

功能简介:

选择项目,「维护>组件管理」中可以检查

检查各类监控仪表板

应用场景:

对于服务器、工程和工程中的组件,运维平台提供对应监控看板,监控各个指标情况

当指标出现异常时,会标黄/标红显示

功能简介:

选择项目,在「项目监控」中,可以查看各个监控看板,查看异常指标项

检查健康巡检异常项

应用场景:

运维平台会定期对FR/BI工程进行体检,管理员要根据体检报告改善工程配置

功能简介:

选择项目,「健康巡检>系统巡检」中,根据修改建议优化工程

3. FineBI异常处理编辑

本节操作均在运维平台中完成。

问题解决方案
应用监控与告警

当系统运行出现异常时,会触发系统的告警规则

当触发告警后,会通过告警方式通知管理员

管理员根据告警内容,优化问题,提前解决问题

宕机恢复与分析

当系统宕机之后

1)运维平台可根据宕机处理策略,自动重启工程,恢复进程

2)运维平台提供此次宕机的原因和处理方案,可根据方案优化

3)宕机后自动导出堆栈日志,运维平台可对日志进行分析,可根据分析报告优化

运维日志下载

出现任何问题,需要分析工程日志时,可通过运维平台快速下载日志到本地进行分析

配置更新与启停如果检测到是FR/BI工程或组件的配置不合理,需要进行调整时:

1)对于FR/BI项目组件,可通过组件管理功能对Nginx/Redis/配置库进行配置修改

2)对于FR/BI工程,可通过「业务配置更改」功能修改工程配置,确保工程平稳运行