我一直在尝试Cascading,但是我看不出相对于经典的map reduce方法来编写作业有什么优势。
Map Reduce的工作给了我更多的自由,而Cascading似乎带来了很多障碍。
对于使简单的事情变得简单而复杂的事情,可能会做得很好。
有什么我想念的吗?与经典方法相比,层叠有明显的优势吗?
在哪种情况下,我应该选择层叠而不是经典方法?有人使用它感到高兴吗?
最佳答案
我已经使用Cascading几年了。我发现它非常有帮助。最终,这与生产力的提高有关。与纯Java代码相比,我在创建和维护M / R作业方面效率更高。原因如下:
尽管可以将许多预先构建的组件组合在一起,但是如果看起来处理逻辑的特定部分看起来像只用纯Java编写就容易了,则始终可以创建一个Cascading函数来包装它。这使您可以享受Cascading的好处,但是可以将非常自定义的操作编写为直接的Java函数(实现Cascading接口(interface))。