假设在MR作业中,映射器仅给出两个唯一键。我将 reducer 数量设置为4 。现在,我的hashpartitioner将始终将两种类型的密钥发送给两个reducer,假设R1和R2。
我想知道R3和R4会发生什么。 他们在跑步吗?如果没有,那为什么呢?
还可以形成多少个零件文件?


谢谢

最佳答案

它们之所以运行,是因为它们将在知道它们将不会接收任何密钥之前启动。将创建四个部分文件,但是其中两个将不包含任何记录。

关于hadoop - reducer 数量逻辑,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/28790880/

10-16 03:03