我有一个包含许多记录的数据集。
考虑记录的前两个字段是field1和field2。
如果field1或field2的值为AA,则必须在映射过程中跳过此记录。
请帮助我的程序。
最佳答案
在mapper类中,您可以将if条件设置为
if((field1!='AA')||(field2!='AA')){
//your code here
}
如果条件将跳过具有值“ÁA”的字段,您将能够处理其余记录,并将结果返回到上下文。
关于hadoop - 跳过mapreduce中具有特定值(value)的记录,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43025120/