Map Reduce Design Patterns Book



我无法理解该语句的含义,这像是一般观察还是在使用TotalOrderPartitioner时可以实际实现?

我们可以以某种方式要求TotalOrderPartitioner不创建分区文件,而仅使用已经创建的分区文件吗?

基本上,使用TotalOrderPartitioner时可以跳过分析阶段吗?

最佳答案

使用TotalOrderPartitioner可以很容易地实现它:

   TotalOrderPartitioner.setPartitionFile(job.getConfiguration(), partitionFile); // use existing file!!!

   // InputSampler.writePartitionFile(job, sampler); // Just comment out this line!!!

请注意,来自javadoc:



如果您重新运行排序-如果您的数据稍有变化并且示例仍应很好地代表它-您可以将现有分区文件与示例一起使用,因为InputSampler在客户端上创建该分区文件非常昂贵。但是您必须使用与InputSampler创建分区文件的作业中使用的数量相同的Reducer。

关于hadoop - 总订单划分的分析阶段,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/21959861/

10-12 22:51