我有一个带有list列“c”的data.table:

df <- data.table(a = 1:3, c = list(1L, 1:2, 1:3))
df
   a     c
1: 1     1
2: 2   1,2
3: 3 1,2,3

我想为“c”中的值创建单独的列。

我创建了一组新列F_1,F_2,F_3:
mmax <- max(df$a)
flux <- paste("F", 1:mmax, sep = "_")
df[, (flux) := 0]

df
   a     c F_1 F_2 F_3
1: 1     1   0   0   0
2: 2   1,2   0   0   0
3: 3 1,2,3   0   0   0

我想像这样将“c”中的值分派(dispatch)到F_1,F_2,F_3列:
df

   a     c F_1 F_2 F_3
1: 1     1   1   0   0
2: 2   1,2   1   2   0
3: 3 1,2,3   1   2   3

我尝试过的是:
comp_vect <- function(vec, mmax){
  vec   <- vec %>% unlist()
  n     <- length(vec)
  answr <- c(vec, rep(0, l = mmax -n))
}


df[ , ..flux := mapply(comp_vect, c, mmax)]

预期的data.table是:
> df

   a     c F_1 F_2 F_3
1: 1     1   1   0   0
2: 2   1,2   1   2   0
3: 3 1,2,3   1   2   3

最佳答案

我采用了截然不同的方法。我对列表列进行了rbind编码,然后对其进行了dcast编码,从而获得了所需的结果。最后一部分是设置名称。

library(data.table)
df <- data.table(a = 1:3, d = list(1L, c(1L, 2L), c(1L, 2L, 3L)))

df2 <- df[, rbind(d), by = a][, dcast(.SD, a ~ V1, fill = 0)]

setnames(df2, 2:4, flux)[]
   a F_1 F_2 F_3
1: 1   1   0   0
2: 2   1   2   0
3: 3   1   2   3

其中flux是您在问题中定义的名称的变量。

请注意,避免使用列名c,因为它可能与c()函数混淆。

关于r - 将列表列中的值分配到单独的列,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/58630447/

10-12 22:39