Rabbitmq–主机断电重启无法启动服务

  • Post author:
  • Post category:其他




0.环境

两节点rabbitmq主备集群

节点 通信端口 版本
master 5672(监听端口)/15672(web端口)/25672(集群通信端口) rabbitmq-server-3.7.0/erlang-19.3.6.4
slave 5672(监听端口)/15672(web端口)/25672(集群通信端口) rabbitmq-server-3.7.0/erlang-19.3.6.4



1.问题描述

机房停电,导致物理机断电,服务非正常停止;恢复电力后,重启rabbitmq报错。



2.排查解决



2.1日志排查

启动报错信息如下:

在这里插入图片描述

日志报错如下:

在这里插入图片描述



2.2问题解决

1)删除数据路径下的mnesia路径,之后重启集群节点,集群节点正常启动

缺陷:如果主节点首先故障,删除主从节点的mnesia路径,重启服务,那么服务之前的信息必然都已经不存在了,需要重新创建,如rabbitmq的web的用户密码,和一些saas服务的vhost等等。

2)先去从节点启动rabbitmq,之后启动主节点,服务即正常【服务正常后可以再按照原来主-从的顺序重新停启一遍】。

如遇到相同问题,建议先尝试方法2解决问题,如果使用方法1的话,还要还原之前rabbitmq的很多信息



3.猜测

在断电重启的时候,发现主节点日志有一条连接不到从节点的日志信息,但是网络通畅端口开通,并没有问题,但是从节点没有启动,因为是安装先主后从的思路启动,所以启动主后主主动连接从而连接不上,导致主节点报错退出?;

所以测试先启动从,再启动主,发现问题解决了,那么该问题应该就不是数据因为掉电重启而导致数据异常的故障了。

在这里插入图片描述



版权声明:本文为qq_35767346原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。