考虑一个简单的Java文件,该文件创建一个BufferedInputStream
以将本地文件1400-8.txt
复制到Hadoop HDFS并打印一些点作为进度状态。该示例是Hadoop书here中的示例3-3。
// cc FileCopyWithProgress Copies a local file to a Hadoop filesystem, and shows progress
import java.io.BufferedInputStream;
import java.io.FileInputStream;
import java.io.InputStream;
import java.io.OutputStream;
import java.net.URI;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;
import org.apache.hadoop.util.Progressable;
// vv FileCopyWithProgress
public class FileCopyWithProgress {
public static void main(String[] args) throws Exception {
String localSrc = args[0];
String dst = args[1];
InputStream in = new BufferedInputStream(new FileInputStream(localSrc));
Configuration conf = new Configuration();
FileSystem fs = FileSystem.get(URI.create(dst), conf);
OutputStream out = fs.create(new Path(dst), new Progressable() {
public void progress() {
System.out.print(".");
}
});
IOUtils.copyBytes(in, out, 4096, true);
}
}
// ^^ FileCopyWithProgress
我编译代码并使用以下命令创建JAR文件hadoop com.sun.tools.javac.Main FileCopyWithProgress.java
jar cf FileCopyWithProgress.jar FileCopyWithProgress.class
上面的命令生成文件FileCopyWithProgress.class
,FileCopyWithProgress$1.class
和FileCopyWithProgress.jar
。然后,我尝试运行它hadoop jar FileCopyWithProgress.jar FileCopyWithProgress 1400-8.txt hdfs://localhost:9000/user/kostas/1400-8.txt
但是,我收到错误据我了解,
FileCopyWithProgress$1.class
是由于程序声明的匿名回调函数引起的。但是,既然文件存在,这里的问题是什么?我运行的命令顺序正确吗? 最佳答案
我发现了问题,因此我只是在发布,以防它对某人有所帮助。我必须在JAR中包括FileCopyWithProgress$1.class
类。正确的应该是
jar cf FileCopyWithProgress.jar FileCopyWithProgress*.class