我的端点服务器现在可以在s3a文件系统中正常工作,现在我想支持s3n://
和s3://
有人对实现这一目标有什么建议吗?
最佳答案
seek()
操作的恶劣处理(现在,基础库在每次向后查找时都读取到文件末尾。这会降低ORC / Parquet列数据的性能。由于这些问题及其过时的事实,在ASF JIRA上与s3n相关的所有错误都以WONTFIX的形式关闭。
从s3n移至s3a。您的生活会更好。
要知道当您使用s3a时,AWS库的版本和所有hadoop- * JAR必须同步。 hadoop- * JAR彼此依赖,并且aws- * JAR随着时间的推移变得足够脆弱,以至于hadoop每次升级都需要进行认真的重新测试,经常更改API,针对AWS开发工具包SDK团队提交的错误,等等。只会创建异常的堆栈跟踪,并以INVALID(无效)关闭:“那么不要这样做”。
现在,如果您真的想测试s3n支持,
如前所述,s3n的问题不会得到解决。你的家庭作业。也许是S3A的,但是您必须证明这是s3a库本身的错误。