我正在尝试访问Spark中的hadoop文件,但出现此错误

org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: hdfs://localhost:9000/ex1/cen.csv
  at org.apache.hadoop.mapred.FileInputFormat.singleThreadedListStatus(FileInputFormat.java:287)


我可以在hadoop中显示文件
hadoop dfs -cat ex1/cen.csv

最佳答案

当你尝试

hadoop dfs -cat ex1/cen.csv

在HDFS中读取文件的路径是
/user/.../ex1/cen.csv

但是如果你尝试
hadoop dfs -cat /ex1/cen.csv

目录/ ex1必须放置在根目录/
您正在尝试做什么
 hdfs://localhost:9000/ex1/cen.csv

是从根目录读取的,我认为您的文件不存在,因为
/ex1/cen.csv

ex1/cen.csv

是不同的路径。

关于apache-spark - var hFile = sc.textFile (“hdfs://localhost:9000/ex1/cen.csv”)输入路径不存在错误,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/61873840/

10-16 07:40