是否可以使用C#代码将Hadoop分布式文件系统文件编写为序列文件。如果可以的话,您能建议我一个链接或其他详细信息吗?

最佳答案

我没有在Hadoop工作中使用C#,但是我们可以做到这一点。

在JAVA中

  Configuration conf = new Configuration();
    Job job = new Job(conf);
    job.setOutputFormatClass(SequenceFileOutputFormat.class);

这将写入SequenceFile。同样在C#中应该是这样的
  HadoopJobConfiguration myConfig = new HadoopJobConfiguration();

            myConfig.InputPath = "/demo/simple/in";

            myConfig.OutputFolder = "/demo/simple/out";

更新:
 HadoopJobConfiguration myConfig = new HadoopJobConfiguration();

                myConfig.InputPath = "/demo/simple/in";

                myConfig.OutputFolder = "/demo/simple/out";
                myConfig.outputformat  =  // Your needed o/p format

希望这会给你一个想法

关于c# - hadoop中的序列文件格式,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/27615615/

10-11 04:05