创建数据仓库的过程中,往往会遇到这样的问题,例如:源表由于业务原因新增了字段,而ETL程序中是按照之前的源表结构进行抽取的,那么如果不重新构建ETL程序,新的指标就不会流入DW,问题如下图所示

创建了一个简单的输入输出

kettle中源和目标表结构不一致的情况处理-LMLPHP

如下图所示,源表中有一个column3字段没有被匹配到

kettle中源和目标表结构不一致的情况处理-LMLPHP

下面我们可以打开sql编辑器,看看该字段的类型,然后在目标表中增加该字段就好了

kettle中源和目标表结构不一致的情况处理-LMLPHP

PS:注意要谨慎点击sql编辑器中的执行按钮,该按钮虽然会自动的给目标表添加对应于源表所需的字段,但是如果之前目标表有

注释内容什么的就会被这个操作覆盖掉,该执行只是执行了简单的创建表操作.

另外如果要及时让新增表字段在目标表中生效,必须要清除一下目标表对应的DBlink的数据缓存

如下图:

第一种方法就是在上面的sql编辑器窗口

kettle中源和目标表结构不一致的情况处理-LMLPHP

第二种方法就是在转换的DBlink列表

kettle中源和目标表结构不一致的情况处理-LMLPHP

05-08 08:24