我正在处理一个大的二进制数据文件(> 10GB),使用readBin大约需要10分钟才能读取该文件,但是后来我被困在试图将其强制转换为矩阵,大概是因为我的机器内存不足。当我使用python时,我会在这种情况下使用numpy.mmemap来减少内存占用; R有什么等价物吗?

最佳答案

也许这可以帮助您:

library(ff)
library(biglm)
data <- ffm("binarydata")


您也可以只选择其中的一部分,因此可以节省内存:

data <- ffm("binarydata", c("col1", "clo2", "col3"))

09-26 00:20