问题描述
我刚刚开始试验 AWS SageMaker,想将 S3 存储桶中的数据加载到我的 SageMaker python jupyter 笔记本中的 Pandas 数据帧中以进行分析.
I've just started to experiment with AWS SageMaker and would like to load data from an S3 bucket into a pandas dataframe in my SageMaker python jupyter notebook for analysis.
我可以使用 boto 从 S3 获取数据,但我想知道是否有更优雅的方法作为 SageMaker 框架的一部分在我的 Python 代码中执行此操作?
I could use boto to grab the data from S3, but I'm wondering whether there is a more elegant method as part of the SageMaker framework to do this in my python code?
提前感谢您的建议.
推荐答案
如果你看看 此处 似乎您可以在 InputDataConfig 中指定它.在文档中搜索S3DataSource"(ref).第一个命中甚至是 Python,第 25/26 页.
If you have a look here it seems you can specify this in the InputDataConfig. Search for "S3DataSource" (ref) in the document. The first hit is even in Python, on page 25/26.
这篇关于将 S3 数据加载到 AWS SageMaker Notebook 中的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!