我正在为客户端建立数据管道。我在事物的分析方面已经花费了很多年,但现在我正在一家只真正具有生产环境的小商店工作。
我们要做的第一件事是创建生产的复制实例,但是我想运用某种数据仓库的思路来简化分析部分。

我的问题归结为使用什么工具?还有,为什么呢?我一直在寻找Talened等ETL解决方案,但对Airflow也非常感兴趣。问题是我不确定哪个更适合我的需求。我想轻松地监视和创建作业(我很流利地编写了python,所以Airflow作业创建不是问题),而且还能够在输入数据时对其进行转换。

任何建议都非常感谢

最佳答案

请考虑talend的开源(Talend Open Studio)不提供任何监视/调度功能。它只是“代码生成器”。更复杂的基础结构是企业版的一部分。

关于etl - ETL与工作流管理,哪些适用?可以一样使用吗?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/39389767/

10-10 20:26