在我的map-reduce作业中,映射器的输出类型为<Text, FileAlias>
,类FileAlias
具有两个属性,如下所示
public class FileAlias extends Configured implements WritableComparable<FileAlias>{
public boolean isAlias;
public String value;
...
}
对于每个输出键(
Text
类型),只有一个输出值(FileAlias
类型)将isAlias
属性设置为true。我希望此输出值成为送入reducer的OutputCollector
中的第一项。有什么办法吗? 最佳答案
看一看Job
对象上的setGroupingComparatorClass方法。您应该能够实现一个比较器,该比较器在传递给reduce任务的Iterable中首先使FileAlias
与isAlias == true
一起使用。