datax是一个高效的,支持多种数据源的ETL离线工具,阿里巴巴通过他每天导入3PB的数据,但是由于功能比较属于大众化,有一些不太满足各自的业务场景(如我们的需求在导入的过程中,需要kill掉回滚等),这时候就需要自己更改阿里的源码,需要下载源码,修改源码,调试,才便于定位问题。本文主要说idea怎么开启datax远程调试。供各位同行分析源码。
datax开启远程debug模式
/apps/datax/bin/datax.py /apps/datax/job/237724067.json -d
即在后面添加-d 即可,默认端口为9999,也可以自行修改datax.py文件第35行
REMOTE_DEBUG_CONFIG = "-Xdebug -Xrunjdwp:transport=dt_socket,server=y,address=9999"
idea远程监听9999端口
datax入口类:com.alibaba.datax.core.Engine
以下依次点击:
、
点击apply ,ok ,回到Engine类:
需要的地方打断点测试:
至此完成~!
版权声明:本文为gucapg原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。