1、首先测试 cm agent 连接至 cm server 7182端口,看是否联通(是连通)
2、然后尝试 hard_restart agent 后依旧无法修复
3、观察到许多 hive bdr 依旧和 cm server 保持通信,开始怀疑是同步任务压力过大。强制停掉此agent后,kill 掉后台所有的hive进程,再启动这个 cm agent)
service cloudera-scm-agent next_stop_hard
service cloudera-scm-agent stop
ps -a | grep hive #找出hive进程号
kill -9 [进程号]
service cloudera-scm-agent start
然后成功了,不再报错。
结论:
由于跑了太多的hive replication,所以有好几个datanode挂了。需要hard stop,kill掉后台的hive进程后再重启。
版权声明:本文为qq_22498427原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。