我有30个数据运行,每个数据存储在一个单独的CSV文件runi.csv中,i = 0:29。
假设我想将它们全部收集到一个列表中。我知道如何做到这一点的最好方法是
runs = list()
for (i in 1:30) { runs[[i]] = read.csv(paste("run", i-1, ".csv")); }
现在让我们进一步说一下,存储在列表中的每个数据帧具有相同的列布局,并且我对“x”标识的列和“y”标识的列感兴趣。
绘制所有30个运行的(x,y)对值的最简单方法是什么?这是我目前的做法(我认为必须有更好的方法):
xList = list()
yList = list()
for (i in 1:30) { xList[[i]] = runs[[i]]$x; yList[[i]] = runs[[i]]$y; }
matplot(x=as.data.frame(xList), y=as.data.frame(yList))
当我尝试对数据进行转换时,这会变得更加痛苦。我不知道如何将函数应用于列表中存储的每个数据框的特定列。
这里的任何帮助将非常有帮助。
最佳答案
处理此类列表时,最好使用l * ply函数(来自plyr)或lapply。
导入的最简单方法可能是这样的:
library(plyr)
runs <- llply(paste("run",1:30,".csv",sep=""), read.csv)
这是绘制它们的一种方法:
# some dummy data
runs <- list(a=data.frame(x=1:5, y=rnorm(5)), b=data.frame(x=1:5, y=rnorm(5)))
par(mfrow=c((length(runs)/2),2));
l_ply(1:length(runs), function(i) { plot(runs[[i]]$x, runs[[i]]$y) })
当然,您也可以将其输出到其他设备(例如pdf),而不使用
par()
。