可以一行完成吗?该示例是针对两个变量的,但是我想将其用于更多变量,这使此方法变得麻烦。
library(ggplot2)
library(data.table)
library(dplyr)
a <- dcast(mpg, year ~ cyl, fun=length, value.var = "cyl")
b <- dcast(mpg, year ~ class, fun=length, value.var = "class")
c <- inner_join(a, b, by = "year")
> c
year 4 5 6 8 2seater compact midsize minivan pickup subcompact suv
1 1999 45 0 45 27 2 25 20 6 16 19 29
2 2008 36 4 34 43 3 22 21 5 17 16 33
最佳答案
如果我们使用data.table
,那么首先使用melt
并使用dcast
library(data.table)
dcast(melt(as.data.table(mpg[c('year', 'cyl', 'class')]),
id.var = 'year'), year ~ value)
链接
[]
的版本如下所示:mpg = as.data.table(mpg[c('year', 'cyl', 'class')])
mpg[ , melt(.SD, id.var = 'year')
][ , dcast(.SD, year ~ value, fun.aggregate=length)]
或者使用
recast
中的reshape2
(单行)library(reshape2)
recast(mpg[c('year', 'cyl', 'class')], id.var = 'year', year ~ value)
# year 2seater 4 5 6 8 compact midsize minivan pickup subcompact suv
#1 1999 2 45 0 45 27 25 20 6 16 19 29
#2 2008 3 36 4 34 43 22 21 5 17 16 33
注意:列'cyl','class'具有不同的'type'。但是,因为我们只在寻找
length
,所以可以关于r - 单独广播多列,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/59343907/