是否可以使用C#代码将Hadoop分布式文件系统文件编写为序列文件。如果可以的话,您能建议我一个链接或其他详细信息吗?
最佳答案
我没有在Hadoop工作中使用C#,但是我们可以做到这一点。
在JAVA中
Configuration conf = new Configuration();
Job job = new Job(conf);
job.setOutputFormatClass(SequenceFileOutputFormat.class);
这将写入SequenceFile。同样在C#中应该是这样的
HadoopJobConfiguration myConfig = new HadoopJobConfiguration();
myConfig.InputPath = "/demo/simple/in";
myConfig.OutputFolder = "/demo/simple/out";
更新:
HadoopJobConfiguration myConfig = new HadoopJobConfiguration();
myConfig.InputPath = "/demo/simple/in";
myConfig.OutputFolder = "/demo/simple/out";
myConfig.outputformat = // Your needed o/p format
希望这会给你一个想法
关于c# - hadoop中的序列文件格式,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/27615615/