请帮忙,
我有以下示例数据:

-21.33,45.677,1234,1245,1267,1290,1212,1111,10000,1902
-21.34,45.677,1264,1645,1266,1260,1612,1611,16000,1602
-21.35,45.677,1244,1445,1467,1240,1242,1211,11000,1912
-21.36,45.677,1231,1215,1217,1210,1212,1111,10010,1902

我希望我的hadoop mapreduce代码应将前两个浮点条目视为键(-21.33,45.677),将其余整数条目视为值(1234,1245,1267,1290,1212,1111,10000,1902)。

我不确定是否可以使用现有的FileInputFormats完成。
因此,在知道该值应作为数组而不是文本使用的情况下,我该如何处理。

另外,我应该如何更改inputSplit,以便能够同时获取映射中的多个记录以进行计算。

最佳答案

最简单的方法是使用TextInputFormat并让您的映射器在键和值之间进行分割。
然后,映射器的输出键和值都可以是Text。

关于java - 自定义INputFormat,Hadoop,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/11694134/

10-12 02:15