我想知道在 Talend 中解决以下问题的最佳策略是什么:
我有点困惑,因为我不知道在 Talend 中是否可行。我看到了 tFileInputDelimited 组件,但我没有找到解决它的方法。
谢谢
最佳答案
要从一个目录读取多个文件,您可以使用 tFileList 组件。它允许您指定目录和文件名模式。与模式匹配的目录中的所有文件都将被一个接一个地处理。
您需要使用从 tFileList 组件到描述您要对每个文件执行的操作的那些组件的“迭代”链接。在您的情况下,您将从 tFileInputDelimited 组件(读取文件)开始并将其主要输出连接到 tMysqlOutput 组件。默认情况下,MySQL 组件只会将数据附加到现有表中,这样应该会得到您想要的结果。
在 tFileInputDelimited 组件中,您不会使用固定文件名,而是使用由 tFileList 组件为每次迭代设置的变量文件名(可以说是您的循环变量)。该循环变量的名称可以在工作室的“大纲” View 中看到,通常在左下角。
关于etl - 在 Talend 中加载一组文件的策略,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/6295499/