datax debug远程调试

  • Post author:
  • Post category:其他


datax是一个高效的,支持多种数据源的ETL离线工具,阿里巴巴通过他每天导入3PB的数据,但是由于功能比较属于大众化,有一些不太满足各自的业务场景(如我们的需求在导入的过程中,需要kill掉回滚等),这时候就需要自己更改阿里的源码,需要下载源码,修改源码,调试,才便于定位问题。本文主要说idea怎么开启datax远程调试。供各位同行分析源码。


datax详细介绍及源码下载


开发新的插件数据源


datax开启远程debug模式

/apps/datax/bin/datax.py /apps/datax/job/237724067.json -d

即在后面添加-d 即可,默认端口为9999,也可以自行修改datax.py文件第35行

 REMOTE_DEBUG_CONFIG = "-Xdebug -Xrunjdwp:transport=dt_socket,server=y,address=9999"

在这里插入图片描述


idea远程监听9999端口

datax入口类:com.alibaba.datax.core.Engine

以下依次点击:

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

点击apply ,ok ,回到Engine类:

在这里插入图片描述

需要的地方打断点测试:

在这里插入图片描述

至此完成~!



版权声明:本文为gucapg原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。