【Kettle从零开始】第七弹之Kettle作业中常用组件介绍

  • Post author:
  • Post category:其他




关于

Kettle

版本信息同第三弹,这里我就不再说明。


对于在作业中,大家所经常使用到的是组件如“

START

”、“

Truncate tables

”、“

Job

”、“

Transformation

”、“

Success

”、“

Mail

”、“

SQL

”等。本弹就不一一详细讲解。如有需要了解更多,详见【


Kettle

学习手册

】。




开始(


Start







屏幕截图






图标






功能说明



Start


是任务执行的入口,首先必须是任务可以执行。只有无条件的任务条目可以从


Start


入口连接。



注:大家在开始过程当中最好只把它当成一个入口组件,不要使用它来做定时任务计划之类的工作,如果做定时任务有产生


JAVA JVM


内存溢出,这是一个


BUG


,在


Kettle


官网也说明不提倡使用此组件来做定时任务。








裁剪表(


Truncate tables







屏幕截图






图标






功能说明



用来清空指定表中所有数据组件,类似与


Oracle





Truncate


语法。




组件说明



选项


描述


Job entry name


步骤的名称,在单一的步骤中,名称必需唯一


数据库连接


读取数据的数据库连接


Previous results to args


通过上一步骤参数传递到此步骤使用


Tables name


填写需要清空的表名


Schema name


表名的模式名








转换(


Transformation







屏幕截图






图标






功能说明



此转换组件是用来执行已经定义好的转换。




组件说明



选项


描述


Job


名称


任务条目的名称,在单个任务中,必须唯一


转换名称


需要运行的转换的名称


资源库路径


指定资源库目录中的文件名


转换文件名


如果你不是使用资源库工作,就指定转换运行的


XML


文件名


指定文件日志


检查是否为转换指定一个单独的日志文件


Apped logfile


是否以追加的方式写入日志文件


日志文件名


日志文件的目录和名称


日志文件后缀名


文件名扩展(例如:


log


或者


txt




日志文件包含日期


文件名中添加系统日期


日志文件包含时间


文件名中添加系统时间


日志级别


日志级别


复制以前结果到参数


复制以前结果到参数


Copy previous  results to parameters


上一次的转换结果复制到参数中


执行每一行输入行


支持循环,根据参数结果集执行每一行参数


在执行之前清除结果行列表


在转换运行之前,检查确保列表或结果行已经被清除


在执行之前清除结果文件列表


在转换运行之前,检查确保列表或结果文件已经被清除


在集群模式下运行这个转换


是否使用集群模式运行转换


Remote save  server


执行集群节点服务器




执行


SQL


脚本(


Execute SQL scripts







屏幕截图






图标






功能说明



使用


SQL


任务条目执行


SQL


脚本,多行脚本之前用


“;”


隔开。




组件说明



选项


描述


作业项名称


任务条目的名称,在单个任务中,必须唯一


数据库连接


数据库连接名称


从文件中得到的


是否指定以文件形式执行


SQL


SQL


文件名


指定


SQL


文件完整路径


使用变量替换


如果


SQL


脚本中有使用到变量需要勾选


SQL


脚本


要执行的


SQL


脚本




作业(


Job







屏幕截图






图标






功能说明



此作业组件是用来执行已经定义好的作业,

切勿设计死循环





组件说明



选项


描述


作业项名称


作业名称,在单个任务中,必须唯一


作业名称


需要运行的作业的名称


资源库路径


指定资源库目录中的文件名


作业文件名


如果你不是使用资源库工作,就指定作业运行的


XML


文件名


指定文件日志


检查是否为转换指定一个单独的日志文件


Apped logfile


是否以追加的方式写入日志文件


日志文件名


日志文件的目录和名称


日志文件后缀名


文件名扩展(例如:


log


或者


txt




日志文件包含日期


文件名中添加系统日期


日志文件包含时间


文件名中添加系统时间


日志级别


日志级别


将上一结果作为参数


上一次结果作为参数使用


Copy previous  results to parameters


上一次的转换结果复制到参数中


执行每一行输入行


支持循环,根据参数结果集执行每一行参数


Remote save  server


执行集群节点服务器




成功(


Success







屏幕截图






图标






功能说明



此组件用来标识当前作业执行状态,在一个作业中可以有


0


个或者多个“


Success


”组件。




邮件(


Mail







屏幕截图






图标






功能说明



可以使用


Mail


任务条目来发送


e-Mail






组件说明



选项


描述


地址标签


邮件作业名称


邮件作业名称,在单个任务中,必须唯一


目的地址


填写需要发送指定的邮箱地址


抄送


需要抄送人邮箱地址


暗送


需要暗送人邮箱地址


回复名称


邮件回复名称


回复地址


邮件回复地址


Reply to


回复


联系人


在发送邮件内容中显示联系人


联系电话


在发送邮件内容中显示联系人电话


服务器标签


SMTP


服务器


SMTP


服务器,如


163





smtp.163.com




端口


端口,则是


SMTP


服务器,如


163





25




用户验证


是否需要用户验证


用户名


RotKang


密码


RotKang


使用安全证


是否需要安全验证


安全连接类型


默认为


SSL


邮件消息标签


信息里带日期


在邮箱内容中显示服务器日期


只发邮件注释


在发送邮件内容里只显示注释里的内容


使用


HTML


邮件格


使用


HTML


邮件格,目前测试不准确


编码


字符集编码


管理优先级


默认


优先级


默认


重要


默认


主题


邮件主题名称


注释


邮件内容说明


附件标签


带附件


目前测试有问题,勾选无效


文件类型


目前测试有问题


压缩成文件统一格式


目前测试有问题


压缩文件名称


目前测试有问题



注:



Mail



组件总体来说还是能发送邮件的,但目前还存在一些小问题,估计后续版本会完善。



版权声明:本文为yvigmmwfn原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。