• 我已经创建了输入文本文件test.txt并将其作为/user/yogesh/Input/test.txt放入HDFS
  • 在HDFS上创建的输出路径为/ user / yogesh / Output
  • 在本地/home/yogesh/WordCount.jar上创建jar文件,并从本地提交MR作业,如下所示:hadoop jar /home/yogesh/WordCount.jar WordCount /user/yogesh/Input/test.txt /user/yogesh/Output/output1

  • 我有以下错误:



    hdfs:host / user / yogesh /-是我的HDFS目录。我无法理解为什么此MR作业在HDFS中寻找代码以及如何解决此错误。

    最佳答案

    尝试给WordCount类的名称包作为前缀,或者跳过该类,仅使用jar,input,output,如下所示:

    hadoop jar /home/yogesh/WordCount.jar /user/yogesh/Input /user/yogesh/Output/output1
    

    另外,在执行此命令之前,请确保/user/yogesh/Output/output1不存在。另外,请注意,您应该提供输入目录,而不是输入文件。 Hadoop将指定目录中的所有文件作为输入。

    有关示例,请参见this site中如何运行WordCount示例。

    10-06 13:51