嗨,我有一个MR2作业,该作业需要将用snappy压缩的avro数据作为输入,对其进行处理,然后将数据输出到avro格式的输出目录中。期望该输出的Avro数据也应该进行快速压缩,但不是。
MR作业是仅 map 作业。

我在代码中设置了以下属性
conf.set("mapreduce.map.output.compress", "true");conf.set("mapreduce.map.output.compress.codec", "org.apache.hadoop.io.compress.SnappyCodec");
但是输出仍然没有快速压缩

最佳答案

下面的把戏FileOutputFormat.setCompressOutput(job, true);FileOutputFormat.setOutputCompressorClass(job, org.apache.hadoop.io.compress.SnappyCodec.class);
请注意,这已经在设置输出路径之前完成,并且设置顺序与上述相同。

关于hadoop - mapreduce作业未正确设置压缩编解码器,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/30659547/

10-12 02:38