我必须使用hadoop mapreduce代码解析x12文件。有人可以建议我该怎么做吗?解析后的输出应由其他 hive 工具(如配置单元)消耗

谢谢,
罗克托

最佳答案

我们需要更多信息,但需要一个较高的层次:

  • 根据您的语言获取或创建X12解析器。
    https://code.google.com/p/x12-parser/
    http://www.smooks.org/mediawiki/index.php?title=Main_Page
  • 决定要执行的mapreduce工作:

    每个X12文档的
  • XML树
  • 一堆细分
  • ???
  • 编写一份获取X12文档的工作(您没有说文件的存储方式,但我假设您的X12 HDFS中有文件),并使用解析器向下游发出任何您想要的文件。
  • 10-04 18:28