我正在处理大型数据帧,并且遇到了RAM限制。此时,我可能需要使用磁盘上的序列化版本。有a few packages支持内存不足操作,但是我不确定哪一个适合我的需求。我希望将所有内容都保留在数据帧中,因此ff包看起来很令人鼓舞,但是仍然存在无法解决的兼容性问题。

当您意识到数据已达到内存不足规模时,最先使用的工具是什么?

最佳答案

您可能希望查看以下软件包:

  • ff用于“平面文件”存储和非常有效的检索(可以执行data.frame;不同的数据类型)
  • bigmemory用于R内存不足,但仍在RAM(或文件支持)中使用(只能做矩阵;相同的数据类型)
  • biglm用于使用lm()glm()样式模型的内存不足模型。

  • 并查看High-Performance Computing任务 View 。

    关于r - 存储和使用对内存而言太大的数据帧的最佳做法?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/1875795/

    10-13 07:30
    查看更多