我正在尝试将数据从一个HDFS复制到另一个HDFS。有什么建议为什么第一个有效但是第二个无效吗?
(作品)
hadoop distcp hdfs://abc.net:8020/foo/bar webhdfs://def.net:14000/bar/foo
(不起作用)
hadoop distcp webhdfs://abc.net:50070/foo/bar webhdfs://def:14000/bar/foo
谢谢!
最佳答案
如果两个群集运行的HDFS版本不兼容,则
您可以使用webhdfs
协议(protocol)在它们之间进行distcp
。
hadoop distcp webhdfs://namenode1:50070/source/dir webhdfs://namenode2:50070/destination/dir
如果使用
HTTP
,则应在source和destination命令中提供NameNode URI和NameNode的webhdfs
端口。关于hadoop - Hadoop distcp无法正常工作,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/30808734/