本文介绍了在2个日期之间对数据框进行分组的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

自1993年以来,我一直在使用巴西指数(IBOV)的每日收益,我试图找出对两个日期之间的时间段进行分类的最佳方法。

I am working with daily returns from a Brazilian Index (IBOV) since 1993, I am trying to figure out the best way to subset for periods between 2 dates.

数据框( IBOV_RET )如下:

head(IBOV_RET)
        DATE    1D_RETURN
1 1993-04-28 -0.008163265
2 1993-04-29 -0.024691358
3 1993-04-30  0.016877637
4 1993-05-03  0.000000000
5 1993-05-04  0.033195021
6 1993-05-05 -0.012048193
...

我将2个变量 DATE1 DATE2 设置为日期

I set 2 variables DATE1 and DATE2 as dates

DATE1 <- as.Date("2014-04-01")
DATE2 <- as.Date("2014-05-05")

我能够使用以下代码创建新的子集:

I was able to create a new subset using this code:

TEST <- IBOV_RET[IBOV_RET$DATE >= DATE1 & IBOV_RET$DATE <= DATE2,]

它有效,但是我想知道是否有更好的方法在两个日期之间对数据进行子集的一种方式,也许使用 subset

It worked, but I was wondering if there is a better way to subset the data between 2 date, maybe using subset.

推荐答案

正如@MrFlick所指出的那样,您不会绕过子集的基本逻辑。一种简化子集特定数据框架的方法是定义一个函数,该函数接受两个输入,例如 DATE1 DATE2 在您的示例中,然后根据那些子集参数返回 IBOV_RET 的子集。

As already pointed out by @MrFlick, you dont get around the basic logic of subsetting. One way to make it easier for you to subset your specific data.frame would be to define a function that takes two inputs like DATE1 and DATE2 in your example and then returns the subset of IBOV_RET according to those subset parameters.

myfunc <- function(x,y){IBOV_RET[IBOV_RET$DATE >= x & IBOV_RET$DATE <= y,]}

DATE1 <- as.Date("1993-04-29")
DATE2 <- as.Date("1993-05-04")

Test <- myfunc(DATE1,DATE2)    

#> Test
#        DATE  X1D_RETURN
#2 1993-04-29 -0.02469136
#3 1993-04-30  0.01687764
#4 1993-05-03  0.00000000
#5 1993-05-04  0.03319502

您也可以直接在 myfunc :

myfunc(as.Date("1993-04-29"),as.Date("1993-05-04")) #will produce the same result

这篇关于在2个日期之间对数据框进行分组的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

09-22 07:06