如何在R中绘制非常大的数据集?
我想使用箱形图, fiddle 图或类似图形。无法将所有数据放入内存。我可以逐步阅读并计算绘制这些图所需的摘要吗?如果可以,怎么办?
最佳答案
作为对Dmitri answer的评论的补充,该函数使用ff
大数据处理包来计算分位数:
ffquantile<-function(ffv,qs=c(0,0.25,0.5,0.75,1),...){
stopifnot(all(qs<=1 & qs>=0))
ffsort(ffv,...)->ffvs
j<-(qs*(length(ffv)-1))+1
jf<-floor(j);ceiling(j)->jc
rowSums(matrix(ffvs[c(jf,jc)],length(qs),2))/2
}
这是一种精确的算法,因此它使用排序-可能会花费很多时间。