我正在尝试在色调中运行 mapreduce 作业。我按照以下步骤操作:

  Fill out the Edit Node form
    1)Enter ooziemrwf as the name, and "oozie MapReduce workflow" as the description.

   2) Navigate to the JAR file location and upload the JAR file.

   3) Click the Add Property button and add each of these four properties:
    Property Name
    Value
    mapred.mapper.class org.apache.oozie.example.SampleMapper
    mapred.reducer.class    org.apache.oozie.example.SampleReducer
    mapred.output.dir   /user/mapr/mapreducejob/wfoutput
    mapred.input.dir    /oozie/examples/input-data/text

   4) Navigate to the JAR file and select it as the input path.

    5)Click Done. The MapReduce action appears in the workflow.

   6) Click Save.

Under Actions in the navigation panel, click Submit. When the Submit this job? dialog appears, click Submit.

我上传了工作 jar 添加的属性,但我无法理解第 4 步,即导航到 JAR 文件并选择它作为输入路径。有人可以告诉那究竟是什么吗?你可以引用 http://doc.mapr.com/display/MapR/Working+with+Hue

最佳答案

不确定此时您是否能够“运行”任何东西。
有很多事情可能会出错。

我假设您正在使用 HUE 来创建作业定义。

  • 检查 map-reduce runner 是否能够复制您的 hadoop 集群上的目录。这通常意味着您在 HDFS 中有一个/var/tmp/oozie 目录(具有正确的用户/组权限)。如果目录丢失,就会出现问题。
  • 如果您使用的是 MapReduce2 与 mapred,则 Yarn 尝试混合 mapred 和 mapreduce 包可能会出现问题。在这种情况下,最好的办法是作为 HUE 的“java”作业运行,然后您可以明确管理天气,它是 MapReduce 或 mapred。
  • 包括运行中的一些输入和一些输出。显示您的作业定义和输出错误会有所帮助。
  • 关于hadoop - 色调步骤中的 Mapreduce 工作不清楚,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/22892021/

    10-16 21:35