1.介绍
kettle是一款基于java的免费开源的ETL工具。
1.抽取数据高效稳定.
2.易配置,可以在windows,linux,unix上运行。
3.允许管理来自不同数据库的数据。
4.有两种脚本文件。1.transformation,完成对数据的基础转换。
2.job,对整个工作流程的控制。
5.图形化界面设计,kettle提供图形化的界面,通过图形化界面设计做什么义务。
6.定时功能。在job的start模块,有一个定时功能,可以每天,每周等方式进行定时。
2.环境准备
1.首先在GitHub上下载源码,地址是:
https://github.com/pentaho/pentaho-kettle
,选择自己要下载的版本,解压后如下:
2.在kettle官网上下载发行版,地址:
https://community.hitachivantara.com/docs/DOC-1009855
。解压后
3.开始部署
1.在eclipse创建一个java project ,名为kettle-src,java的环境设置为jdk或者jre,不能设置为javaSE,不然会有报错。
2.在次项目下创建4个source folder,分别为core ,dbdialog,engine,ui。
3.进入刚才解压的源码目录,把pentaho-kettle-7.1.0.12-R\core\src中的所有都拷入我们创建的core里,其他的dbdialog,engine,ui一样,但是ui还要把pentaho-kettle-7.1.0.12-R\assembly\package-res\ui下的文件也拷贝到ui。
4.在kettle-src上创建一个lib文件夹,把发行版lib目录下的jar包拷贝如kettle-src的lib文件里,但是要并删除kettle-core-7.1.0.0-12.jar、kettle-dbdialog-7.1.0.0-12.jar、kettle-engine-7.1.0.0-12.jar三个jar包,还要把libswt目录下,对应的系统的swt.jar包拷贝到项目的lib目录下,最后将lib下所有的jar包添加到项目的build path中。
5.在项目根目录下新建plugins文件夹,然后根据需要将kettle发现版本下的plugins里面的插件拷贝到plugins目录下
如图:
3运行项目:
运行项目有两个方法:
1.可以直接在项目上run as →java application ,然后输入spoon就ok
2.进入run configurations里面去进入配置,如图
运行成功: