我对R非常陌生,正在寻找重新创建Excel VBA宏和Excel工作表函数(例如SUMIFS)的方法。如果该行的其他列上具有匹配多个条件的条目,则SUMIFS会对该列求和。

我有下面的数据框,我想计算一个新列。新列是与SampleStart Date范围重叠的所有行的EndDate的总和。例如,在1行上,它将是697(第一个3 lines的总和)。求和的标准特别是:如果Sample,则包括EndDate >= StartDate[i] & StartDate <=EndDate[i]

 StartDate   EndDate    Sample  *SUMIFS example*
 10/01/14   24/01/14    139         *697*
 12/01/14   26/01/14    136
 19/01/14   02/02/14    422
 25/01/14   08/02/14    762
 29/01/14   12/02/14    899
 05/02/14   19/02/14    850
 07/02/14   21/02/14    602
 09/02/14   23/02/14    180
 18/02/14   04/03/14    866

任何评论或指针,将不胜感激。

最佳答案

您可以使用循环或笛卡尔合并来实现。我不知道有任何内置函数可以做到这一点。

library(dplyr)

x = structure(list(StartDate = structure(c(1389312000, 1389484800,
1390089600, 1390608000, 1390953600, 1391558400, 1391731200, 1391904000,
1392681600), tzone = "UTC", class = c("POSIXct", "POSIXt")),
    EndDate = structure(c(1390521600, 1390694400, 1391299200,
    1391817600, 1392163200, 1392768000, 1392940800, 1393113600,
    1393891200), tzone = "UTC", class = c("POSIXct", "POSIXt"
    )), Sample = c(139L, 136L, 422L, 762L, 899L, 850L, 602L,
    180L, 866L)), .Names = c("StartDate", "EndDate", "Sample"
), row.names = c(NA, -9L), class = "data.frame")

x2 = x
names(x2)=c('StartDate2','EndDate2','Sample2')
x3 = merge(x,x2,allow.cartesian =T)
x4 = summarise(group_by(x3,StartDate,EndDate),
    sumifs=sum(Sample2[EndDate2 >= StartDate & StartDate2 <= EndDate]))
x_sumifs = merge(x,x4,by=c('StartDate','EndDate'))

这就是输出的样子。
> x_sumifs
   StartDate    EndDate Sample sumifs
1 2014-01-10 2014-01-24    139    697
2 2014-01-12 2014-01-26    136   1459
3 2014-01-19 2014-02-02    422   2358
4 2014-01-25 2014-02-08    762   3671
5 2014-01-29 2014-02-12    899   3715
6 2014-02-05 2014-02-19    850   4159
7 2014-02-07 2014-02-21    602   4159
8 2014-02-09 2014-02-23    180   3397
9 2014-02-18 2014-03-04    866   2498

关于r - R中的Excel SUMIFS等效项,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/26720897/

10-11 23:04
查看更多