我有为数据集中每个单独的 ID 创建的 rle() 类对象,现在我想将它们绘制在单独的直方图中,这些直方图显示各种长度类的频率,以便了解它们的分布情况,但我不能似乎不知道如何做到这一点。
我使用以下代码通过对具有各种 ID 的数据运行 rle() 函数来获得 rle() 类对象的列表:
list.runs<-dlply(data.1, .(ID), function(x) rle(x$flights))
但这使得无法将数据传输到数据帧中,因为无法将 rle() 对象强制转换为数据帧。因此,我取消了它们的分类:
list.runs<-dlply(data.1, .(ID), function(x) unclass(rle(x$flights)))
但是我不能将这些数据放入数据框中,因为列表的长度不同。
runs<-ldply(do.call(data.frame,list.runs))
Error in function (..., row.names = NULL, check.rows = FALSE, check.names = TRUE, :
arguments imply differing number of rows: 14, 13
问题:如何为每个单独的 ID 绘制长度值的直方图?
数据(简化):
> dput(data.1)
structure(list(ID = c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L,
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L,
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L,
3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L,
3L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L,
4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L), flights = c(1, 1, 1,
1, 0, 0, 1, 0, 1, 0, 0, 1, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 0, 1,
0, 0, 0, 1, 0, 1, 1, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 1,
1, 0, 0, 0, 1, 1, 0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0, 1, 1, 1, 1,
1, 0, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 0, 1, 0, 0, 1, 1, 0, 0, 0,
1, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1)), .Names = c("ID", "flights"
), row.names = c(NA, -100L), class = "data.frame")
最佳答案
我不知道你想做什么,但我会在这里展示如何:
require(plyr)
list.runs <- ddply(data.1, .(ID), function(x) {
rr <- rle(x$flights)
data.frame(freq=rr$lengths, xvar=seq_along(rr$lengths))
})
require(ggplot2)
ggplot(data = list.runs, aes(x = factor(xvar), y = freq)) +
geom_bar(stat = "identity", aes(fill=factor(ID))) +
facet_wrap( ~ ID, ncol=2)
给你:
编辑: 遵循 OP 的评论:您也可以直接从该数据中获取。事实上,您不必为您的要求生成“xvar”。从
list.runs
:ggplot(data = list.runs, aes(x = factor(freq))) +
geom_bar(aes(weights = ..count.., fill=factor(ID))) +
facet_wrap( ~ ID, ncol=2)
给出:
关于r - 从 rle() 类对象列表中绘制多个直方图,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/15363334/