我试图了解如何在不使用循环的情况下有条件地替换数据框中的值。我的数据框的结构如下:

> df
          a b est
1  11.77000 2   0
2  10.90000 3   0
3  10.32000 2   0
4  10.96000 0   0
5   9.90600 0   0
6  10.70000 0   0
7  11.43000 1   0
8  11.41000 2   0
9  10.48512 4   0
10 11.19000 0   0

dput输出是这样的:
structure(list(a = c(11.77, 10.9, 10.32, 10.96, 9.906, 10.7,
11.43, 11.41, 10.48512, 11.19), b = c(2, 3, 2, 0, 0, 0, 1, 2,
4, 0), est = c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0)), .Names = c("a",
"b", "est"), row.names = c(NA, -10L), class = "data.frame")

我想做的是检查b的值。如果b为0,我想将est设置为a中的值。我知道df$est[df$b == 0] <- 23会将est的所有值设置为23。我不明白的是,当该条件为true时,如何将b==0设置为est的值。例如:
df$est[df$b == 0] <- (df$a - 5)/2.533

给出以下警告:
Warning message:
In df$est[df$b == 0] <- (df$a - 5)/2.533 :
  number of items to replace is not a multiple of replacement length

有没有一种方法可以让我传递相关的单元格,而不是 vector ?

最佳答案

由于您要有条件地索引df$est,因此还需要有条件地索引替换 vector df$a:

index <- df$b == 0
df$est[index] <- (df$a[index] - 5)/2.533

当然,变量index只是临时的,我使用它来使代码更具可读性。您可以一步编写它:
df$est[df$b == 0] <- (df$a[df$b == 0] - 5)/2.533

为了获得更好的可读性,您可以使用within:
df <- within(df, est[b==0] <- (a[b==0]-5)/2.533)

结果,无论选择哪种方法:
df
          a b      est
1  11.77000 2 0.000000
2  10.90000 3 0.000000
3  10.32000 2 0.000000
4  10.96000 0 2.352941
5   9.90600 0 1.936834
6  10.70000 0 2.250296
7  11.43000 1 0.000000
8  11.41000 2 0.000000
9  10.48512 4 0.000000
10 11.19000 0 2.443743

正如其他人指出的那样,您的示例中的另一种解决方案是使用ifelse

关于r - 有条件地替换data.frame中的值,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/8214303/

10-12 19:52