试图了解为binwidth
中的每个因子水平分配唯一的geom_histogram
。
到目前为止,失败了。
这是可复制的数据
a <- rnorm(10,7,0.1)
b <- rnorm(10,13,5)
df <- data.frame(data = c(a,b),group=c(rep("a",10),rep("b",10)))
kk <- df%>%
group_by(group)%>%
mutate(bin=density(data)$bw)
binns <- round(unique(kk$bin),digits = 2) # to get each binwidth for each group
ggplot()+
geom_histogram(data=kk,aes(x=data, fill=group),binwidth=binss)+
facet_wrap(~group,scales=c("free_y"))
Error in seq.default(round_any(range[1], size, floor), round_any(range[2], :
'from' must be of length 1
Error in seq.default(round_any(range[1], size, floor), round_any(range[2], :
'from' must be of length 1
Error in exists(name, envir = env, mode = mode) :
argument "env" is missing, with no default
然后我尝试
ggplot()+
geom_histogram(data=kk,aes(x=data, fill=group),binwidth=c(binns[1],binns[2]))+
facet_wrap(~group,scales=c("free_y"))
发生相同的错误。我不明白为什么会出现同样的错误。
最佳答案
您可以在垃圾箱上迭代以创建图层
library(dplyr)
a <- rnorm(10,7,0.1)
b <- rnorm(10,13,5)
df <- data.frame(data = c(a,b),group=c(rep("a",10),rep("b",10)))
kk <- df %>%
group_by(group) %>%
mutate(bin=round(density(data)$bw, 2))
binns <- unique(kk$bin)
附加
ggplot2
library(ggplot2)
在列表中为每个bin值创建一个直方图图层,并仅包含该bin的数据。如果您有30个级别,则将有30个直方图图层的列表
lp_hist <- plyr::llply(binns, function(b) {
geom_histogram(data = kk %>%
filter(bin == b),
aes(x = data, fill=group),
binwidth = b)
})
合并这些图层,并将其全部添加到
ggplot()
对象p_hist <- Reduce("+", lp_hist, init = ggplot())
根据需要构面和缩放
p_hist + facet_grid(. ~ group, scales = "free_y")
您将获得想要的图形,即按面表示不同的binwidth。
提防,因为30个级别将赋予30个方面...这很多。
注意:在
dplyr 0.4.3
上使用ggplot2 2.1.0
,plyr 1.8.3
和R 3.2.3