如何在R中绘制非常大的数据集?

我想使用箱形图, fiddle 图或类似图形。无法将所有数据放入内存。我可以逐步阅读并计算绘制这些图所需的摘要吗?如果可以,怎么办?

最佳答案

作为对Dmitri answer的评论的补充,该函数使用ff大数据处理包来计算分位数:

ffquantile<-function(ffv,qs=c(0,0.25,0.5,0.75,1),...){
 stopifnot(all(qs<=1 & qs>=0))
 ffsort(ffv,...)->ffvs
 j<-(qs*(length(ffv)-1))+1
 jf<-floor(j);ceiling(j)->jc
 rowSums(matrix(ffvs[c(jf,jc)],length(qs),2))/2
}

这是一种精确的算法,因此它使用排序-可能会花费很多时间。

09-27 20:50