我需要为 Hadoop MapReduce 应用程序实现自定义(服务)输入源。我 google'd 和 SO'd 并发现继续的一种方法是实现自定义 InputFormat。那是对的吗?

显然,根据 http://hadoop.apache.org/common/docs/r0.20.2/api/org/apache/hadoop/mapred/InputFormat.html InputFormat 的方法 getRecordReader() 和 getSplits() 已被弃用。什么是替代品?

Hadoop 的 WordCount 示例仍然使用相同的...

最佳答案

来自 the documentation:

由于 0.20.2 的奇怪弃用行为,甚至在弃用接口(interface)后使用实现的更奇怪的建议,我挖得更深一些。此接口(interface)仍然存在于 0.21.0 中,但已删除弃用标记。在撰写本文时,我在后备箱中找不到类似的界面。

关于Hadoop MapReduce InputFormat 已弃用?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/4384224/

10-12 22:59