我正在寻找一种有效地将函数应用于data.table的每一行的方法。让我们考虑以下数据表:

library(data.table)
library(stringr)

x <- data.table(a = c(1:3, 1), b = c('12 13', '14 15', '16 17', '18 19'))
> x
   a     b
1: 1 12 13
2: 2 14 15
3: 3 16 17
4: 1 18 19

假设我想按空格分割b列的每个元素(从而为原始数据中的每一行产生两行)并联接结果数据表。对于上面的示例,我需要以下结果:
   a V1
1: 1 12
2: 1 13
3: 2 14
4: 2 15
5: 3 16
6: 3 17
7: 1 18
8: 1 19

如果a列仅具有唯一值,则可以使用以下内容:
x[, list(str_split(b, ' ')[[1]]), by = a]

以下几乎可以工作(除非原始数据表中有一些相同的行),但是当x具有许多列并将b列复制到结果中时,这很难看,我想避免这种情况。
>     x[, list(str_split(b, ' ')[[1]]), by = list(a,b)]
   a     b V1
1: 1 12 13 12
2: 1 12 13 13
3: 2 14 15 14
4: 2 14 15 15
5: 3 16 17 16
6: 3 16 17 17
7: 1 18 19 18
8: 1 18 19 19

解决这个问题的最有效,最惯用的方法是什么?

最佳答案

怎么样 :

x
   a     b
1: 1 12 13
2: 2 14 15
3: 3 16 17
4: 1 18 19

x[,list(a=rep(a,each=2), V1=unlist(strsplit(b," ")))]
   a V1
1: 1 12
2: 1 13
3: 2 14
4: 2 15
5: 3 16
6: 3 17
7: 1 18
8: 1 19

广义解给出评论:
x[,{s=strsplit(b," ");list(a=rep(a,sapply(s,length)), V1=unlist(s))}]

关于r - 将函数应用于data.table的每一行,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/15673662/

10-12 23:21