我正在尝试访问Spark中的hadoop文件,但出现此错误
org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: hdfs://localhost:9000/ex1/cen.csv
at org.apache.hadoop.mapred.FileInputFormat.singleThreadedListStatus(FileInputFormat.java:287)
我可以在hadoop中显示文件
hadoop dfs -cat ex1/cen.csv
最佳答案
当你尝试
hadoop dfs -cat ex1/cen.csv
在HDFS中读取文件的路径是
/user/.../ex1/cen.csv
但是如果你尝试
hadoop dfs -cat /ex1/cen.csv
目录/ ex1必须放置在根目录/
您正在尝试做什么
hdfs://localhost:9000/ex1/cen.csv
是从根目录读取的,我认为您的文件不存在,因为
/ex1/cen.csv
ex1/cen.csv
是不同的路径。
关于apache-spark - var hFile = sc.textFile (“hdfs://localhost:9000/ex1/cen.csv”)输入路径不存在错误,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/61873840/