kettle软件 转换和作业_Kettle入门–作业和转换的使用

  • Post author:
  • Post category:其他


本来想在centos7下部署的,发现因为java版本的问题,无法成功部署,无奈,转到windows平台(后来找到解决方法了,在centos7系统下yum install webkitgtk* -y 就可以了,注意执行spoon.sh时需要在桌面环境下执行,我直接在xshell下执行,会报错,无法弹出图形界面)

下载地址

https://jaist.dl.sourceforge.net/project/pentaho/Pentaho%208.0/client-tools/pdi-ce-8.0.0.0-28.zip

另外必需部署好java环境

解压,需要把mysql连接的jar文件放到lib文件夹下

启动spoon

点击spoon.ba即可

先新建一个转换:文件-》新建-》转换

开始新建数据库连接:选中DB连接右键-》新建

把DB连接下面的两个数据库,直接拖曳到右边(里面的test表和linux表都是我自己创建的)

其中那个箭头是选中表输入后,按住shift键,连接到表输出

最后,点击执行,作业1标签(这个只是用来说明位置)下的倒三角运行按钮

查看linux表,有新插入的数据

效果

上面是转换的使用,现在我们来试一下作业的使用。作业具体用处不是很清楚,我只是用到了其中一个定时执行的作用,下面来看一下例子(效果是每分钟执行以下上面的转换,zh.ktr是上面的转换执行时提示的保存位置)

看一下有没有成功自动执行(本来只有几条数据,然后跑了一晚上,直接变成两千多条)

kettle——入门操作-行列转换(行转列,字段拆分)

1.Row Normaliser,将一行多列数据转换为多行一列数据. 输入数据流: 计算器配置如下: 与计算器相连接的excel输出如下: Row Normaliser,设置如下, 与Row No …

Kettle入门教程

最近做的项目用到了ETL工具Kettle,这个工具相当好用,可以将各种类型数据作为数据流,经过处理后再生成各种类型的数据.正如其名“水壶”,将各个地方的水倒进水壶里,再用水壶倒入不同的容器.不过一来初 …

kettle入门大数据管理工具

研究 kettle 的使用 大佬博客:https://www.cnblogs.com/mq0036/p/9238646.html 国内镜像下载:http://mirror.bit.edu.cn/pen …

关于Kettle的事务和转换内步骤的顺序执行

关于Kettle的事务和转换内步骤的顺序执行 近来有项目中遇到Kettle事务处理和转换内步骤顺序执行的问题.为此进行了研究,找到了一个解决办法. 在Kettle中,一个Job内的转换,缺省是顺序执行 …

如何在命令行下运行kettle的作业(job)和转换(transform)

pan 是执行转换的. Pan.bat /file C:\test.ktr /logfile c:\log.txt /level Basic kitchen是执行job的. kitchen.bat / …

Kettle入门

kettle  水壶 正如其名“水壶”,将各个地方的水倒进水壶里,再用水壶倒入不同的容器. 勺子-Spoon.bat/spoon.sh 图形界面工具,就是启动上图主界面的命令行. ketchen 厨房 …

Kettle入门及性能优化FAQ

1.安装 配置Java环境 Java环境配置问题 java_home:D:\Program Files\Java\jdk1.7.0_25(安装jdk路径) classpath:.;%java_home …

kettle入门(七) 之kettle增量方案(一)全量比对取增量-依据唯一标示

引: ods有个project表来自于上游系统,数据量不大 十几万,下游系统须要此数据,而且须要每天提供截止当天的增量数据 要求每条数据给出数据变化时间及标示,即数据若是插入 有插入时间和插入标示 若 …

随机推荐

使用insertBefore实现insertAdjacentHTML()

Element.insertAdjacentHTML()方法由IE引入,并在HTML5中标准化,它将任意的HTML标记字符串插入到指定的元素“相邻”的位置. insertAdjacentHTML()有 …

re

Python3正则表达式应用: 目的:获取匹配的字符串 输出:直接输出或是.group() / .group(0) 常用函数: re.compile 可以把正则表达式编译成一个正则表达式对象,这样可以 …

[DeviceOne开发]-轮播图和多模板的简单示例

一.简介 这个例子是利用Slideview组件实现循环轮播的效果,同时这个slideview作为一个listview的最上面的一行数, 1. listview有2个模板,一个是以slideview为核 …

mongoDB windows安装

http://www.mongodb.org/ mongodb的官方文档. http://www.cnblogs.com/lipan/archive/2011/03/08/1966463.html  …

saltstack通过salt.client执行命令(转)

利用saltstack的salt.client模块可以在python的命令行下或者python脚本里执行相应的salt命令 master端想要执行类似 salt ‘*’ cmd.run ‘uptime …

asterisk

http://www.asterisk.org/ asterisk is the world’s most widely adopted open source commnuctions platfo …

8、双向一对多的关联关系(等同于双向多对一。1的一方有对n的一方的集合的引用,同时n的一方有对1的一方的引用)

双向一对多关联关系 “双向一对多关联关系”等同于“双向多对一关联关系”:1的一方有对n的一方的集合的引用,同时n的一方有对1的一方的引用. 还是用客户Customer和订单Order来解释: “一对多 …

HttpWebResponse类

HttpWebResponse类的作用用于在客户端获取返回的响应的信息,还记得HttpResponse类吗?你是否在写B/S程序的时候,经常用到Response.Write()呢? HttpRespo …

multiprocessing.Process() ———-python中的多进程

python 当中 使用封装好的 multiprocessing 为我们实现创建多进程任务. 1 Process()方法创建子进程 使用multiprocessing.Process() 方法产生一个 …

Keil uVision4 创建51单片机工程

Keil uVision4 创建51单片机工程 版权声明:未经授权,严禁转载! 在学习51单片机的过程当中,我们需要使用 Keil uVision4 来创建一个项目,今天就来图示一下创建的流程. 首先 …



版权声明:本文为weixin_31197675原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。