有没有一种方法可以估计数据帧的大小而无需将其加载到内存中?我已经知道我没有足够的内存来存储要创建的数据帧,但是我不知道要完全创建它需要多少内存。

最佳答案

我相信您正在寻找df.memory_usage,它将告诉您每列将占用多少。

总共会像这样:

df.memory_usage().sum()


输出:

123123000


您可以做一些更具体的事情,例如包括Index(Index = True)或使用Deep功能,它将“深入了解数据”。随时检查文档!

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.memory_usage.html

关于python - 估计 Pandas 数据框大小而无需加载到内存中,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/58884590/

10-13 00:32
查看更多