我有一个包含许多记录的数据集。
考虑记录的前两个字段是field1和field2。
如果field1或field2的值为AA,则必须在映射过程中跳过此记录。
请帮助我的程序。

最佳答案

在mapper类中,您可以将if条件设置为

if((field1!='AA')||(field2!='AA')){

 //your code here
}

如果条件将跳过具有值“ÁA”的字段,您将能够处理其余记录,并将结果返回到上下文。

关于hadoop - 跳过mapreduce中具有特定值(value)的记录,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43025120/

10-16 18:19
查看更多