我有一些调查数据,人们回答了他们强烈同意,不同意,不同意的说法。他们的响应可以是1到4之间的任何值(包括小数)(1 =强烈不同意,2 =不同意,等等...)。
我想通过在条形图中绘制每个变量的平均值来汇总此数据。我还想将Y轴标签更改为非数字值,但 anchor 1 =完全不同意,2 =不同意,等等的标签。
给定下面包含的数据,我可以使用以下代码完成此操作:
ggplot(data = data, aes(x=factor(key), y=value, fill=key)) +
stat_summary(fun.y="mean", geom="bar", width = 0.5) +
stat_summary(aes(label=round(..y..,1)), fun.y="mean", geom="text", vjust = -0.5) +
geom_hline(yintercept = 3, linetype="solid", color = "red", size=1.5, alpha=0.25) +
scale_y_discrete(limits=c("Strongly Disagree", "Disagree", "Agree", "Strongly Agree"))
这接近我的需要,但是我真的很想使Y轴从1 =完全不同意而不是0开始。
我当时以为我可以从所有数字响应中减去1,但随后每个小节的平均分数标签将是不正确的。
我唯一的约束是我想在
ggplot
内完成此任务,并且希望不要通过改变原始数据的形状来完成。我有另一个这样的图表,其中我使用facet_wrap()
为数据集中的每个组(不包括变量)创建了相同的图表。我已经做了很多搜索,但是似乎不建议在
ggplot
中更改轴的起点。但是,鉴于这种情况,它认为这是可以接受的。data <- structure(list(key = structure(c(1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L,
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L,
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L,
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L,
2L, 2L, 2L, 2L, 2L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L,
3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L,
3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L,
3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L,
3L, 3L, 3L), .Label = c("Clarity", "Appropriateness", "Commitment"
), class = "factor"), value = c(NA, 3.33333333333333, 3.33333333333333,
4, 4, 3, 4, NA, 3, NA, 3, 4, NA, NaN, 3, 2.66666666666667, 3,
NA, 3.33333333333333, 3.66666666666667, 3.66666666666667, 4,
NA, 3, 4, 3.66666666666667, 3, 2.66666666666667, 3, 4, 4, 3,
3, NaN, 3, 4, 3, 4, 3, 4, 4, 2.33333333333333, 3, 4, 4, 3, 4,
3, 3, 3.33333333333333, 3, 4, 3, NA, 2.66666666666667, 3.33333333333333,
4, 2.33333333333333, 3.66666666666667, 4, 4, 3, NA, 3, 4, 3.2,
4, 3, 4, NA, 3.2, NA, 3, 4, NA, 4, 3, 3.4, 3, NA, 2.8, 3.6, 3.6,
3.8, NA, 3, 3.4, 3.2, 3, 3, 3.4, 3.8, 3.6, 3, 3, NaN, 2.4, 4,
3, 3.2, 3.2, 4, 4, 2.6, 3.8, 4, 4, 3.6, 3.2, 3, 3, 4, 2.8, 4,
3, NA, 3.4, 3.4, 4, 2.6, 3.8, 4, 3.4, 3, NA, 2.33333333333333,
4, 3.66666666666667, 4, 3, 4, NA, 3.33333333333333, NA, 4, 4,
NA, 4, 4, 2.33333333333333, 3.66666666666667, NA, 3, 4, 4, 4,
NA, 3.33333333333333, 3, 4, 3.33333333333333, 3.66666666666667,
3.33333333333333, 4, 4, 2.33333333333333, 3.66666666666667, NaN,
3, 4, 3, 3, 4, 3.66666666666667, 4, 3.33333333333333, 4, 3.66666666666667,
4, 4, 4, 3.66666666666667, 3, 3.33333333333333, 3.66666666666667,
3.66666666666667, 2.66666666666667, NA, 2.33333333333333, 3,
4, 3, 3.66666666666667, 4, 4, 4)), class = "data.frame", row.names = c(NA,
-186L))
最佳答案
coord_cartesian()
通过在有限区域上进行绘制而完成工作,同时仍保留数据:
如果您在limits =
中使用scale_y_continuous()
调用,则情节会中断。
码
ggplot(data = data, aes(x = key, y = value, fill = key)) +
stat_summary(fun.y = "mean", geom = "bar", width = 0.5) +
stat_summary(aes(label = round(..y.., 1)),
fun.y="mean", geom="text", vjust = -0.5) +
geom_hline(yintercept = 3, linetype = "solid",
color = "red", size = 1.5, alpha = 0.25) +
# limit the vertical space to 1 to 4, but keep the data
coord_cartesian(ylim = c(1, 4)) +
# set ticks at 1, 2, 3, 4
scale_y_continuous(breaks = c(1:4),
# label them with names
labels = c("Strongly Disagree", "Disagree",
"Agree", "Strongly Agree"))