我正在做一个项目,我需要使用ETL过程将数据加载到数据仓库中。我有csv、非结构化和平面文件格式的数据。我正在考虑使用shell脚本来执行ETL过程。我对bash shell和KornShell(ksh)都知之甚少,但在ETL过程中我还是个新手。所以我的问题是什么是ETL过程更好的选择。我应该用Bash Shell还是KornShell?
有ETL过程和shell脚本经验的用户的回答是非常值得赞赏的。
提前谢谢。
最佳答案
通常,我的ETL进程在数据库转换中使用SQL语句,所以它们实际上是“ELT”进程。shell只是用作移动文件、执行数据加载和提取以及执行SQL语句的工具。如果您的DW是在一个足够强大的系统上,那么它通常是进行转换工作的最佳场所,除非您打算让一个系统位于执行数据转换的EDW之外。
我所描述的ELT过程的外壳选择实际上是一种维护。你走了谁会支持你?公司有很多人知道bash,但只有一个人知道KSH吗?还是99%的网店?然后我建议你用C控制台的小程序来编写ETL。当您不使用真正的“ETL”工具时,选择用于执行ETL的语言应该关注这些因素,而不是“最佳”语言。
关于bash - 使用KornShell还是Bash Shell进行ETL流程?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/14701416/