我有一个大型数据框,其中包含如下所示的数据:
date w x y z region
1 2012 01 21 43 12 3 NORTH
2 2012 02 32 54 21 16 NORTH
3 2012 03 14 32 65 32 NORTH
4 2012 04 65 33 75 21 NORTH
: : : : : : :
: : : : : : :
12 2012 12 32 58 53 17 NORTH
13 2012 01 12 47 43 23 SOUTH
14 2012 02 87 43 21 76 SOUTH
: : : : : : :
25 2012 01 12 46 84 29 EAST
26 2012 02 85 29 90 12 EAST
: : : : : : :
: : : : : : :
我想提取具有相同
date
值的数据部分,例如仅针对2012 01
这样做,我将创建一个数据子集data_1 <- subset(data, date == "2012 01")
这为我提供了
2012 01
的所有数据,但随后我继续对该数据应用一个函数。我希望能够将函数应用于数据的所有可能子集,因此理想情况下,我将遍历大型数据框并提取2012 01, 2012 02, 2012 03, 2012 04...
的数据,然后分别将函数应用于这些数据子集。但是,即使我的数据帧长度发生变化,我也希望能够将其应用于我的数据帧,因此它可能并不总是来自
2012 01 - 2012 12
,日期范围可能会有所不同,因此有时可能会将其用于来自的数据。示例2011 03 - 2013 01
。 最佳答案
这是你想要的吗 ?df_list <- split(data, as.factor(data$date))
关于R:根据日期循环遍历数据帧以提取数据子集,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/18382711/