我正在寻找一个条件密度图,如 R 的内置 cdplot
函数,但使用 ggplot2
。
这是一个普通的 cdplot
示例:
with(iris, cdplot(Sepal.Length, Species))
在 the
ggplot2
book(第 188 页)中,它说以下调用应该是等效的:cdplot(x, y)
qplot(x, fill=y, geom="density", position="fill")
但是,该行为似乎在
ggplot2
的某些更新中出现了问题(它还给出了一条警告,说 `position` is deprecated
):with(iris, qplot(Sepal.Length, fill=Species, geom="density", position="fill"))
我找到了 a blog entry of someone trying to do the same thing ,但显然它现在也坏了(同样的警告,
`position` is deprecated
):cdens <- cdplot(iris$Sepal.Length, iris$Species, plot = F)
x <- seq(min(iris$Sepal.Length), max(iris$Sepal.Length), length.out = 100)
y <- c(cdens[[1]](x), cdens[[2]](x), rep(1, length(x)))
type <- ordered(rep(levels(iris$Species), each = length(x)),
levels=rev(levels(iris$Species)))
x <- rep(x, 3)
qplot(x, y, geom="area", fill = type, position="identity",
xlab="Sepal.Length", ylab="Species") + theme_bw()
有什么方法可以做到这一点?这些例子中有什么问题?
(我想要一个
ggplot
解决方案,因为它具有更好的轴标签和图例,尤其是当自变量是日期时。)更新: 在下面的评论中,@bouncyball 建议使用
ggplot(iris, aes(x = Sepal.Length, fill = Species))+ geom_density(position = 'fill')
,但这样做有所不同:with(data, cdplot(time, cat))
abline(v=as.POSIXct(c('2017-04-01', '2017-03-01')), col='red')
ggplot(data, aes(x=time, fill=cat)) + geom_density(position = 'fill')
cdplot
结果是我想要的,我不确定 ggplot
示例在做什么。 cdplot
结果与因子比匹配,例如 2017 年 3 月:> with(subset(data, time>'2017-03-01' & time <'2017-04-01'), table(cat))
cat
<1s <3s <5s <10s <20s <1m <2m <5m <1h <24h >1d
175484 31837 19078 16146 15013 20200 1142 1207 944 17 0
最佳答案
将计算变量 count
用于堆叠密度图,并根据 cdplot 重新排序物种级别。
library(ggplot2)
ggplot(iris, aes(Sepal.Length, ..count.., fill = forcats::fct_relevel(Species,
levels = c("virginica", "versicolor", "setosa")))) +
geom_density(position = "fill") +
labs(fill = "Species")
关于r - ggplot2 中的 cdplot() 模拟,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/46714058/