我在aws上建立了一个2节点的hadoop集群,其中namenode和jobtracker在主服务器上运行,而tasktracker和datanode既是主服务器又是从服务器。当我启动dfs时,它告诉我它启动了namenode,两个节点上的datanode和辅助namenode。当我启动map reduce时,它还会告诉我jobtracker以及两个节点上的tasktracker均已启动。我开始运行一个示例以确保它可以正常工作,但是它说在namenode Web界面上仅使用了一个tasktracker。我检查了日志并从机检查了从节点上的datanode和tasktracker节点的日志

2013-08-08 21:31:04,196 INFO org.apache.hadoop.ipc.RPC: Server at ip-10-xxx-xxx-xxx/10.xxx.xxx.xxx:9000 not available yet, Zzzzz...
2013-08-08 21:31:06,202 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: ip-10-xxx-xxx-xxx/10.xxx.xxx.xxx:9000. Already tried 0 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1 SECONDS)

namenode在端口9000上运行,它位于datanode日志中。在tasktracker日志中,除了端口9001外,它具有相同的内容。 Jobtracker运行的位置。我可以在apache Wiki上找到有关此错误http://wiki.apache.org/hadoop/ServerNotAvailable的信息
但我找不到他们说的任何可能的问题。由于我在aws上同时运行两个节点,因此我还确保已将权限授予两个端口。

综上所述。

从节点上的tasktracker和datanode不会连接到主节点

我知道IP地址正确,我已经检查了多次

我可以将两个实例的无口令ssh相互传递给自己

向端口授予aws权限

根据日志,namenode和jobtracker都运行良好

我将主服务器和从服务器的ips放在配置文件中,而不是主机名中,因为当我这样做并相应地编辑/ etc / hosts时,它无法解析

有人知道其他可能原因吗?

最佳答案

按照原始海报:

09-11 02:46