CM agent 发送heartbeat给CM server 不断发生 connection refused：timed out

Post author:xfxia
Post published:2023年7月23日
Post category:其他

1、首先测试 cm agent 连接至 cm server 7182端口，看是否联通（是连通）

2、然后尝试 hard_restart agent 后依旧无法修复

3、观察到许多 hive bdr 依旧和 cm server 保持通信，开始怀疑是同步任务压力过大。强制停掉此agent后，kill 掉后台所有的hive进程，再启动这个 cm agent）

service cloudera-scm-agent next_stop_hard 
service cloudera-scm-agent stop 
ps -a | grep hive #找出hive进程号 
kill -9 [进程号]
service cloudera-scm-agent start

然后成功了，不再报错。

结论：

由于跑了太多的hive replication，所以有好几个datanode挂了。需要hard stop，kill掉后台的hive进程后再重启。

原文链接：https://blog.csdn.net/qq_22498427/article/details/110411163

你可能也喜欢