com.amazonaws.AmazonClientException:无法执行 HTTP 请求:不知道此类主机 (spark-tunes.s3a.ap-south-1.amazonaws.com)

本文介绍了com.amazonaws.AmazonClientException:无法执行 HTTP 请求:不知道此类主机 (spark-tunes.s3a.ap-south-1.amazonaws.com)的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我正在尝试通过 pycharm 从本地模式下的 spark 读取存储在 S3 存储桶中的 json 文件.但我收到以下错误消息:

I am trying to read a json file stored in S3 bucket from spark in local mode via pycharm. But I'm getting the below error message:

"py4j.protocol.Py4JJavaError: 调用 o37.json 时发生错误.: com.amazonaws.AmazonClientException: 无法执行 HTTP 请求: 不知道这样的主机 (spark-tunes.s3a.ap-south-1.amazonaws.com)"

(spark-tunes 是我的 S3 存储桶名称).

(spark-tunes is my S3 bucket name).

下面是我执行的代码.请帮助我知道我是否遗漏了什么.

Below is the code I executed. Please help me to know if I'm missing something.

spark = SparkSession.builder.appName('DF Read').config('spark.master', 'local').getOrCreate()

spark._jsc.hadoopConfiguration().set("fs.s3a.access.key", "access_key")
spark._jsc.hadoopConfiguration().set("fs.s3a.secret.key", "secret_key")

spark._jsc.hadoopConfiguration().set("fs.s3a.endpoint", "s3a.ap-south-1.amazonaws.com")
spark._jsc.hadoopConfiguration().set("com.amazonaws.services.s3a.enableV4", "true")
spark._jsc.hadoopConfiguration().set("fs.s3a.impl", "org.apache.hadoop.fs.s3a.S3AFileSystem")

df = spark.read.json("s3a://bucket-name/folder_name/*.json")

df.show(5)

amazonaws

com.amazonaws.AmazonClientException:无法执行 HTTP 请求:不知道此类主机 (spark-tunes.s3a.ap-south-1.amazonaws.com)

问题描述

推荐答案