CM agent 发送heartbeat给CM server 不断发生 connection refused:timed out

  • Post author:
  • Post category:其他


1、首先测试 cm agent 连接至 cm server 7182端口,看是否联通(是连通)

2、然后尝试 hard_restart agent 后依旧无法修复

3、观察到许多 hive bdr 依旧和 cm server 保持通信,开始怀疑是同步任务压力过大。强制停掉此agent后,kill 掉后台所有的hive进程,再启动这个 cm agent)

service cloudera-scm-agent next_stop_hard 
service cloudera-scm-agent stop 
ps -a | grep hive #找出hive进程号 
kill -9 [进程号]
service cloudera-scm-agent start

然后成功了,不再报错。


结论:

由于跑了太多的hive replication,所以有好几个datanode挂了。需要hard stop,kill掉后台的hive进程后再重启。



版权声明:本文为qq_22498427原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。