有没有一种方法可以估计数据帧的大小而无需将其加载到内存中?我已经知道我没有足够的内存来存储要创建的数据帧,但是我不知道要完全创建它需要多少内存。
最佳答案
我相信您正在寻找df.memory_usage
,它将告诉您每列将占用多少。
总共会像这样:
df.memory_usage().sum()
输出:
123123000
您可以做一些更具体的事情,例如包括Index(Index = True)或使用Deep功能,它将“深入了解数据”。随时检查文档!
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.memory_usage.html
关于python - 估计 Pandas 数据框大小而无需加载到内存中,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/58884590/