ETL:抽取(extract)、转换(transform)、加载(load)至目的端的过程;

Kettle是ETL工具代表之一,是pentaho中的一个数据整合的一个组件。Kettle里包括多个Job、转换,一个Job可以包含多个转换,转换是kettle执行的最小单位。

1,创建两个CSV文件:

如图

kettle基础操作-LMLPHP

kettle基础操作-LMLPHP

2,在Spoon.bat中创建两个CSV输入

kettle基础操作-LMLPHP

保存,运行。

3,创建记录集连接

kettle基础操作-LMLPHP

获得链接字段后,选择对应的行,删除多余的行

大致就是:

kettle基础操作-LMLPHP

运行:

kettle基础操作-LMLPHP

3,字段选择

删除多余的行:

kettle基础操作-LMLPHP

运行

4,创建Excel输出,修改文件名和地址即可

kettle基础操作-LMLPHP

生成的Excel文件:

kettle基础操作-LMLPHP

05-29 00:00