我的目录包含将近2,000个.csv文件。
每个文件具有以下结构(显示500行中的4行):
Date;QOF
1 2004-01-04 - 2004-01-10;9
2 2004-01-11 - 2004-01-17;11
3 2004-01-18 - 2004-01-24;13
4 2004-01-25 - 2004-01-31;13
“ QOF”列也是.csv文件的名称,每个文件都有唯一的名称(例如“ MSTF”,“ XQS”等)。我希望将每个.csv文件中的此列合并到第一个正在读取的.csv文件,其中还包含日期变量。换句话说,我想保留第一个文件中的所有列,而仅将所有其他.csv文件中的第二列合并到此文件中。最终结果应类似于:
Date;QOF;MSTF;XQS
1 2004-01-04 - 2004-01-10;9;10;8
2 2004-01-11 - 2004-01-17;11;11;5
3 2004-01-18 - 2004-01-24;13;31;2
4 2004-01-25 - 2004-01-31;13;45;23
到目前为止,我已经尝试过了:
filenames <- list.files()
do.call("cbind", lapply(filenames, read.csv, header = TRUE))
最佳答案
mybig <- do.call( rbind, lapply( listfiles, function(nam){
cbind(name=nam, read.file(paste0(nam,".csv"), header=TRUE) )
}
) )
未经测试。并且请注意,我故意不遵循您建议的结构。我无法想到更混乱的数据结构才能正常工作。您可能正在考虑使用该格式进行输出,并且首先需要构建一个数据框,然后将其写入带有分号分隔符的文件中。