我希望有人可以帮助我解决这个问题。我正在使用每五年记录一次的时间序列数据。数据帧df是一个示例,时间步长为df$Time,并在df$A中记录值。

df
Time    A
5   4.8
10  19.6
15  27.5
20  39.7

我需要做的是将df转换为年度时间序列,并根据计算用新值填充所有新记录。我已使用以下方法成功将df转换为年度数据df2:
df2  <- data.frame("Time" = c(5:20), "A" = c(5:20))
df2$A[] <- sapply(df2$A, function(x) df$A[match(x, df$Time)])
df2[is.na(df2)] <- 0
df2
Time    A
5   4.8
6   0
7   0
8   0
9   0
10  19.6
11  0
12  0
13  0
14  0
15  27.5
16  0
17  0
18  0
19  0
20  39.7

我不知道如何计算df2$A的新值。计算取决于其他行/记录值的相对位置-例如,对于df2$A[2],计算将为df2$A[2] <- df2$A[1] + (df2$A[6] - df2$A[1])/5。它还会在整个数据帧中更改,例如df2$A[7] <- df2$A[6] + (df2$A[11] – df2$A[6]) / 5
for循环只产生了挫败感,而我试图做到这一点而无需为每条新记录编写一行代码(实际数据有数百条记录)。我正在尝试以一种有效的方式使用df3-谢谢!
df3
Time    A
5   4.8
6   7.76
7   10.72
8   13.68
9   16.64
10  19.6
11  21.18
12  22.76
13  24.34
14  25.92
15  27.5
16  29.94
17  32.38
18  34.82
19  37.26
20  39.7

最佳答案

您正在寻找的被称为线性插值。在R中,您可以使用approx函数,如下所示:

df <- data.frame("Time" = c(5, 10, 15, 20), "A" = c(4.8, 19.6, 27.5, 39.7))
df2 <-  as.data.frame(approx(x = df$Time, y = df$A, xout = 5:20))
names(df2) <-  names(df)

结果:
> df2
   Time     A
1     5  4.80
2     6  7.76
3     7 10.72
4     8 13.68
5     9 16.64
6    10 19.60
7    11 21.18
8    12 22.76
9    13 24.34
10   14 25.92
11   15 27.50
12   16 29.94
13   17 32.38
14   18 34.82
15   19 37.26
16   20 39.70

关于r - 将五年数据转换为年度数据并计算R中的新记录,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/52005505/

10-13 02:26