集群常见报错及解决方案 FineReport帮助文档|报表开发|报表使用|学习教程

历史版本7 :集群常见报错及解决方案返回文档

编辑时间:11-07 14:31 历史版本: 最新历史版本上一篇历史版本下一篇历史版本 内容长度:5610 图片数:6目录数:2 修改原因:调整页面

1 集群前端报错
2 平台异常通知

1 集群前端报错编辑

1.1 Redis集群节点异常

报错原因：某个节点出现异常或已经宕掉，无法继续在Redis集群中提供服务。

解决方案：

a、登录Redis集群，输入“cluster nodes”检查Redis集群状态

redis-cli -h ip -p 端口 -a 密码 #客户端远程连接某个节点，输入对应的ip、端口、密码

当我们检查到某个Redis节点是宕机（fail）状态，请及时检查该Redis节点进程，若进程还在，则kill掉进行重启，若进行不在，则直接启动该节点，启动后再次进行检查是否恢复。

b、如果想进一步确认Redis集群的可用性，可以连接某个主节点（master）测试是否能够写入key

正常情况：

异常情况：

当我们检测到Redis集群是无法写入（down）的状态时，此种异常较为罕见，建议重启整个Redis集群。

1.2 节点间jar包不一致报错

报错原因：节点启动过程会与第一个加入集群的节点对比jar包是否一致，若检测到不一致情况，则前端进行异常展示并给出详细的异常信息。

解决方案：参照异常提示，检查各个节点下的jar包并进行调整，调整完毕后重启节点，再观察是否还有报错。

1.3 同步失败报错

报错原因：该节点与文件同步基准节点进行文件同步时，出现同步错误或者请求超时，重复尝试3次仍然无法成功，则前端进行异常展示。

解决方案：检查节点间通信、网络状态是否正常，若有异常则及时进行调整，若一切正常仍为报错，合作客户可联系帆软技术支持进行反馈，非合作客户可以前往帆软论坛反馈。

2 平台异常通知编辑

集群为了便于大家及时发现并排查问题，针对异常情况也会进行异常通知，通知包括邮件通知、短信通知、消息通知，平台开通集群异常提醒即可收到。

异常原因	通知内容	解决方案
jar包不一致	节点#nodename#与节点#nodename#的jar包不一致，将影响集群工程的稳定性，请前往集群节点管理页面查看详细异常信息，并及时处理。	1.2中已给出
节点脱离集群提醒	节点#nodename#已脱离集群环境，可能原因为：节点FullGC、节点宕机、节点间通信不畅、节点负载过高、其他异常。为避免影响用户使用，请及时检查该节点状态，若该节点长时间无法自行恢复，则建议重启该节点。	前往集群节点管理界面，看看报脱离的节点是否还存在。 a、如果节点已经消失，在服务器中查看应用进程，若进程还在，则kill掉再进行重启，若进程已经不在了，则直接重启该节点工程； b、如果节点还存在，则前往智能运维-内存管理或者直接进入服务器内查看节点的内存/CPU占用情况，看看是否有飙升现象，如果节点内存/CPU过高，则重启该节点；上面两种方法仅为临时解决方案，造成节点脱离的原因大致有三个：负载过高导致频繁FullGC、线程阻塞导致内存/CPU飙升、节点宕机。如果想要彻底排查解决问题，合作客户可以联系技术支持协助排查，非合作客户可以在帆软论坛反馈。
节点间时间不一致	节点#nodename#与节点#nodename#系统时间相差超过XX秒，为避免影响用户使用，请及时调整使各节点时间保持一致。	检查各个节点的时间是否一致，当节点间系统时间误差超过30s时会进行报错提醒，因为包括登录等基础功能的使用可能会受到时间不一致的影响。 windows系统可以手动将各个节点的系统时间调为一致，Linux系统调整节点间时间可以参考文档：Linux 系统如何配置各个节点的时间一致性？-https://help.fanruan.com/finereport10.0/doc-view-2727.html
Redis集群节点异常	Redis集群#ip:port#节点已无法正常使用，可能原因为：节点宕机、内存已满、其他异常。为避免影响用户使用，请前往状态服务器配置页面查看详情，并及时处理。	1.1中已给出
文件服务器宕机	文件服务器出现无法正常读写的情况，可能原因为：文件服务器宕机、磁盘已满、其他异常。为避免影响用户使用，请及时检查文件服务器状态。	从三个方向进行排查解决问题： a、检查文件服务器的状态，看看是否是文件服务器宕机了； b、检查配置的WEB-INF目录是否还能正常读写； c、检查文件服务器的磁盘空间剩余情况，可能是磁盘满了导致无法读写，若磁盘满需要扩充磁盘空间。
文件同步失败提醒	集群节点#nodename#与基准节点存在不一致文件，且无法自动同步。请检测该节点状态	1.3中已给出