一、转换和作业定义
转换(Transformation) 和 作业(Job)是Spoon设计器的核心两个内容,这两块内容构建了整个Kettle工作流程的基础。
1. 转换(Transformation):主要是针对数据的各种处理,一个转换里可以包 含多个步骤(Step)。
2. 作业(Job):相较于转换,是更加高级的操作。一个作业里包括多个作业项(Job Entry),一个作业项代表了一项工作,而转换是一种作业项,即作业里面可以包括多个转换。
二、简单实例
1.生成随机数
(1)新建转换,并且保存为demo1
(2)拖入“生成随机数”对象
(3)设置生成随机数的字段和类型
(4)拖入“文本文件输出”对象
(5)连接两个对象:按住“shift”,使用鼠标左键连接两个对象
(6)双击“文本文件输出”对象,设置输出“文件名称”
(7)设置随机数条数
选择10,即产生10条随机数
(8)预览结果
结果:
2.转换(字段选择)
(1)获取输入所有字段
(3)删除tmp3字段
(4)点击运行整个转换
结果
tmp1;tmp2
14997938;-1517993960
-1736221990;-1406677670
-860350842;-1058635217
1789330015;-567467685
-1424594573;-1445076382
-1958817668;-642311912
249411656;-1922281576
-1390362145;1736561661
692375036;1714611011
288716701;-800066384
3.增加常量操作
(1)整体转换图
(2)拖入“增加常量”对象,设置常量constant=1
(3)双击“文本文件输出”,然后获得字段
(4)预览输出结果
结果
4.过滤步骤实例
(1)整个流程
(2)拖入“过滤记录”对象
(3)设置过滤条件:如果字段tmp1值大于0的才被输出到文本文件
(4)预览结果tmp1都是大于0的
5.笛卡尔乘积
(1)整体流程图
(2)双击“自定义常量数据”步骤,设置字段和数据
-》元数据:字段设置
-》数据
(3)双击“自定义常量数据2”步骤,设置字段和数据
-》元数据
-》数据
(4)连接笛卡尔积,预览显示结果总共有2*2条数据
设置预览条件和步骤
结果
三、总结
1.这波操作很简单,只是总结了一些基本的操作,从而可以加深对kettle操作的理解