本着 here 和 here 类似问题的精神,我希望能够对我的 data_frame
中的一系列列求和并创建一个新列:
df_abc = data_frame(
FJDFjdfF = seq(1:100),
FfdfFxfj = seq(1:100),
orfOiRFj = seq(1:100),
xDGHdj = seq(1:100),
jfdIDFF = seq(1:100),
DJHhhjhF = seq(1:100),
KhjhjFlFLF = seq(1:100),
IgiGJIJFG= seq(1:100),
)
# this does what I want
df_abc %>%
mutate(
sum_1 = orfOiRFj + xDGHdj + jfdIDFF + DJHhhjhF
)
显然,如果这个序列中有很多变量,把它们打出来是不可行的。此外,变量的名称不是正则表达式友好的,因此不能通过规则选择,除非它们按顺序出现。
我希望在 tidyverse 中存在一个抽象,它允许类似:
df_abc %>%
mutate(
sum_1 = sum(orfOiRFj:DJHhhjhF)
)
谢谢。
最佳答案
您可以使用 rowSums
来做到这一点:
# option 1
df_abc %>% mutate(sum_1 = rowSums(.[3:6]))
# option 2
df_abc %>% mutate(sum_1 = rowSums(select(.,orfOiRFj:DJHhhjhF)))
结果:
# A tibble: 100 x 9
FJDFjdfF FfdfFxfj orfOiRFj xDGHdj jfdIDFF DJHhhjhF KhjhjFlFLF IgiGJIJFG sum_1
<int> <int> <int> <int> <int> <int> <int> <int> <dbl>
1 1 1 1 1 1 1 1 1 4
2 2 2 2 2 2 2 2 2 8
3 3 3 3 3 3 3 3 3 12
4 4 4 4 4 4 4 4 4 16
5 5 5 5 5 5 5 5 5 20
6 6 6 6 6 6 6 6 6 24
7 7 7 7 7 7 7 7 7 28
8 8 8 8 8 8 8 8 8 32
9 9 9 9 9 9 9 9 9 36
10 10 10 10 10 10 10 10 10 40
# ... with 90 more rows
关于R:使用 dplyr 按行对一系列列求和,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/47590896/