dt <- data.table(Name =c("A","A","A","A","B","B","B","B","B"),
             Number = c(1,3,3,4, 4, 1,1,5,8))

我以这种方式创建了 cumsum 表。
library(matrixStats)
tbl <- round(prop.table(table(dt), 1) * 100, 3)
tbl[] <- rowCumsums(tbl)
names(dimnames(tbl)) <- NULL
tbl[] <-  paste0(sub("^([^.]+)(\\.[^0]).*", "\\1\\2", tbl), "%")
cumsumtable <-  as.data.frame.matrix(tbl)

在原始 dt 中,缺少 2,6 和 7,因此它没有反射(reflect)表格。

r - 带有缺失值的累积和表-LMLPHP

我想要的 cumsum 表是这样的。 2,6 和 7 填充的是之前的百分比。

r - 带有缺失值的累积和表-LMLPHP

最佳答案

我们可以将 'Number' 转换为指定 factorlevels

dt[, Number := factor(Number, levels = min(Number):max(Number))]

然后运行OP的代码
cumsumtable
#   1   2   3    4    5    6    7    8
#A 25% 25% 75% 100% 100% 100% 100% 100%
#B 40% 40% 40%  60%  80%  80%  80% 100%

这也可以在列转换为 factor 后通过 data.table 方法完成
dcast(dt[, .N,.(Name, Number)][, perc := 100*N/sum(N), Name],
     Name ~ Number, value.var = 'perc', fill = 0, drop = FALSE)[,
      (2:9) := lapply(Reduce(`+`, .SD, accumulate = TRUE),
              function(x) paste0(x, "%")), .SDcols = -1][]
#  Name   1   2   3    4    5    6    7    8
#1:    A 25% 25% 75% 100% 100% 100% 100% 100%
#2:    B 40% 40% 40%  60%  80%  80%  80% 100%

关于r - 带有缺失值的累积和表,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/47028373/

10-16 13:57