我在R中有一个样本时间序列:
> str(d)
'data.frame': 5 obs. of 3 variables:
$ date: POSIXct, format: "2010-03-04 20:47:00" "2010-03-04 21:47:00" ...
$ x : num 0 10 11 15.2 20
$ y : num 0 5 7.5 8.4 12.5
> d
date x y
1 2010-03-04 20:47:00 0.0 0.0
2 2010-03-04 21:47:00 10.0 5.0
3 2010-03-04 22:47:00 11.0 7.5
4 2010-03-04 23:47:00 15.2 8.4
5 2010-03-05 00:47:00 20.0 12.5
在此示例中,每小时采集x和y的样本(但时间增量不是固定的)。
x和y值始终在增长(就像汽车中的里程计数器一样)。我需要三角洲
两者之间的增长是多少,如下所示:
1 2010-03-04 20:47:00 0.0 0.0
2 2010-03-04 21:47:00 10.0 5.0
3 2010-03-04 22:47:00 1.0 2.5
4 2010-03-04 23:47:00 4.2 0.9
5 2010-03-05 00:47:00 4.8 4.1
我还需要每个时间的增量(x和y增量,除以时间-每小时的增量)
我将如何在R中执行此操作?
最佳答案
切换到诸如zoo的时间感知数据结构后,只需使用diff()
即可:
> library(zoo)
> DF <- data.frame(date=Sys.time() + 0:4*3600, x = cumsum(runif(5)*10),
y=cumsum(runif(5)*20))
> DF
date x y
1 2010-04-09 15:14:54 9.6282 14.709
2 2010-04-09 16:14:54 12.4041 28.665
3 2010-04-09 17:14:54 18.1643 34.244
4 2010-04-09 18:14:54 27.5785 41.028
5 2010-04-09 19:14:54 33.2779 57.020
> zdf <- zoo(DF[,-1], order.by=DF[,1])
> diff(zdf)
x y
2010-04-09 16:14:54 2.7759 13.9556
2010-04-09 17:14:54 5.7602 5.5792
2010-04-09 18:14:54 9.4142 6.7844
2010-04-09 19:14:54 5.6995 15.9919
>
您可以轻松地将第一行填充,合并等。-有关详细信息,请参见zoo软件包的出色文档。
关于R:计算时间序列中的增量,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/2610521/