历史版本15 :部署运维平台问题排查 返回文档
编辑时间: 内容长度:图片数:目录数: 修改原因:

目录:

概述编辑

版本说明

运维平台版本
功能变动
V1.5.5
-

应用场景

本文将介绍部署FineOps运维平台过程中出现的常见问题和解决方案。

非root用户运行fineKey编辑

推荐使用root用户运行FineKey容器化部署工具。

如需使用非root用户运行FineKey容器化部署工具,需要注意以下三点:

1)用户权限

该用户需要至少拥有以下命令的权限

命令
使用场景
cp安装docker时,cp到/usr/bin等目录下
groupadd添加docker用户组
gpasswd
将非root用户添加到docker用户组
systemctl安装docker时将docker添加到开机自启动服务

非必须项,如果没有权限则跳过

kill

使docker引擎信任该非安全仓库

kill发送信号至docker引擎,使其热加载

sysctl修改 max_map_count

2)执行部署命令

执行./finekey命令时,不要对finekey本身使用sudo,即不要使用sudo ./finekey命令。

finekey启动失败编辑

finekey is already running

报错语句:finekey is already running

原因分析:finekey工具正在运行,需要关闭工具占用的进程,方可重启。

解决方案:通过语句ps -ef|grep finekey,查看相关的进程号,kill -9 进程号 即可。

disk availlable capacity:xxx, less then 500G

报错语句:ERROR: 2022/05/18 17:08:36 node 192.168.1.24 disk availlable capacity:3789952, less then 500G

原因分析:安装时会自动检测finekey.yaml文件中配置的挂载卷目录所在磁盘分区空闲空间要≥500G,默认的~/data代表的目录是/root/data。

解决方案:这是容器化部署的前提,必须满足。请联系相关运维人员对服务器进行扩容。

memory avillable capacity: xxx, less then 16G

报错语句:ERROR: 2022/04/20 14:12:55 node 192.168.101.144 memory avillable capacity: 7302952, less then 16G

原因分析:服务器内存容量不足

解决方案:这是容器化部署的前提,必须满足。请联系相关运维人员对服务器进行扩容。

connection refused

报错语句:ERROR: 2022/05/18 17:33:07 finedb connect error:dial tcp 192.168.1.24:3306: connect: connection refused

原因分析:finekey.yaml文件中配置的相关端口,没有开放,无法连接。

解决方案:请检查服务器相关端口的防火墙、安全组等设置是否开放。

finekey.yaml文件配置错误编辑

mapping values are not allowed in this context

报错语句:ERROR: 2022/04/20 13:56:28 parse config file /Users/carly/finekey/conf/finekey.yaml error: yaml: line 14: mapping values are not allowed in this context

报错原因:yaml 文件对格式的要求非常高,出现该错误,大概率都是由于内容格式存在错误。

解决方案:根据报错提示中的 line 号修改配置文件格式。

address already in use

报错语句:ERROR: 2022/05/18 17:15:23 192.168.1.24 :try bind port error:listen tcp :12100: bind: address already in use

原因分析:端口冲突,已有的组件占用了默认端口。

解决方案:

1)端口确实冲突:打开安装目录下 conf 文件夹里的 finekey.yaml文件,找到对应组件,修改portMapping中映射端口,保存退出后重新运行即可。

2)端口没有冲突:仔细排查安装目录下 conf 文件夹里的 finekey.yaml文件,是否是finekey.yaml中各处字符格式不对,比如漏加空格或用了中文符号等。

can't use localhost

报错语句:ERROR: 2022/04/20 13:58:14 can't use localhost,127.0.0.1 etc as node.ip in cluster mode.. must ensure ensure IP connectivity of all nodes

报错原因:集群下不能使用 localhost 等回环地址作为 IP

解决方案:修改 IP 为其他节点都能访问的真实 IP

add user to docker group error

报错语句:add user to  docker group error:sudo:1次错误密码尝试

解决方案:

1)确保finekey.yaml文件配置的ssh用户和运行finekey的用户保持一致

2)检查finekey.yaml文件中配置ssh用户名密码是否正确

3)远程连接工具问题,关闭重启远程工具并再次尝试

ssh connect error

报错语句:ERROR: 2022/04/20 13:58:14 node:192.168.101.144 ssh connect error:ssh: handshake failed: ssh: unable to authenticate, attempted methods

报错原因:SSH 连接失败,通常报错明细中出现 unable to authenticate 则代表密码有问题;出现 Connection refused 则代表网络不通等可能

解决方案:

1)确保finekey.yaml文件配置的ssh用户和运行finekey的用户保持一致

2)检查finekey.yaml文件中配置ssh用户名密码是否正确

3)远程连接工具问题,关闭重启远程工具并再次尝试

The current path capacity check failed

报错语句:

The current path capacity check failed, please re-enter the path
Enter the folder path and press ENTER to confirm, or enter g then ENTER to exit:

报错原因:

如果部署过程中,检测到挂载目录磁盘可用空间不足100G,会提示「The current path capacity check failed, Please re-enter the path」

默认的~/data目录不代表/data目录,而是对应用户主目录下的/data目录。例如使用root用户部署,则~/data代表的目录为/root/data

解决方案:

用户无需退出部署环节,手动修改yaml文件。可直接输入满足条件的目录,即可继续部署。

升级调整运维平台编辑

在线升级需要开放的外网地址

对于内网环境,如需在线升级FineOps运维平台,需要自行开通网络白名单。


功能
网址
获取镜像/更新运维平台/更新项目组件

域名:fineops-registry.cn-hangzhou.cr.aliyuncs.com

端口:443

获取更新信息

四选一,有一个能联通即可:

https://cloud.fanruan.com/config
https://cloud.fanruan.com:8443/config
http://cloud.fanruan.com/config

http://cloud.fanruan.com:8090/config

升级提示docker engine报错

问题描述:

运维平台升级过程中,提示docker engine相关报错

原因分析:

由于docker引擎、FineOps运维平台、项目的ops_agent组件存在对应关系。

如需手动升级运维平台,必须确保运维平台所在服务器、运维平台对接的项目所在服务器,均支持升级docker引擎。

如在执行finekey update过程中,检测到系统禁止升级docker引擎,就会出现该报错,中断升级。

解决方案:

1)依次分别登录运维平台所在服务器、运维平台对接的项目所在的每一台服务器

2)执行语句,升级docker引擎:./finekey engine --update

3)再次参考上文使用语句启动升级:./finekey update

注意事项:

在升级FineOps运维平台时,如触发了docker引擎升级,运维平台和运维平台对接的项目,均会自动重启,影响终端用户使用。

因此请选择非工作时间进行升级,降低业务影响。

更换运维平台IP

出于安全考虑,部分公司需要定期更换服务器IP。无需重新部署运维平台,即可更换。

1)使用 cd 命令进入finekey工具解压目录下 bin 文件夹

2)键入如下命令执行切换:

./finekey modid 新IP

3)等待执行完成后,即可使用新IP访问运维平台

容器化运维指令编辑

列出一些常用的容器化运维指令:

  • 重启容器指令:docker restart 容器名,例如:docker restart fanruan_fr

  • 查看所有容器运行情况:docker ps -a

  • 启动指定容器:docker start 容器名,例如:docker start fanruan_fr

  • 停止指定容器:docker stop 容器名,例如:docker stop fanruan_fr