我必须实现Mapper_2需要Reducer_1输出的两个mapReduce作业。 Mapper_2还需要另一个输入,即文本文件。如何使用这两个输入来设计mapper_2?换句话说,如何在mapper_2中定义两个输入参数作为mapreduce和文本文件中前一个作业的输出?
最佳答案
以我的理解,问题是您需要使用相同映射器的两个输入路径。我对吗?如果是这样,您可以使用:
MultipleInputs.addInputPath(Job, TextInputPath, SomeInputFormat.class, Mapper_2.class);
MultipleInputs.addInputPath(Job, Ruducer_1OutputPath, SomeInputFormat.class, Mapper_2.class);
关于hadoop - 如何在hadoop中使用两个输入来设计Mapper,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/18744723/