这是我的代码:

#data
sites <-
  structure(list(site = c(928L, 928L, 928L, 928L, 928L, 928L, 928L,
                          928L, 928L, 928L, 928L, 928L, 928L, 928L,
                          928L, 928L, 928L, 928L, 928L, 928L, 928L,
                          928L, 928L, 928L, 928L, 928L),
                 date = c(13493L, 13534L, 13566L, 13611L, 13723L,
                          13752L, 13804L, 13837L, 13927L, 14028L,
                          14082L, 14122L, 14150L, 14182L, 14199L,
                          16198L, 16279L, 16607L, 16945L, 17545L,
                          17650L, 17743L, 17868L, 17941L, 18017L, 18092L),
                 y = c(7L, 7L, 17L, 18L, 17L, 17L, 10L, 3L, 17L, 24L,
                       11L, 5L, 5L, 3L, 5L, 14L, 2L, 9L, 9L, 4L, 7L,
                       6L, 1L, 0L, 5L, 0L)),
            .Names = c("site", "date", "y"),
            class = "data.frame", row.names = c(NA, -26L))

#convert to date
x<-as.Date(sites$date, origin="1960-01-01")

#plot smooth, line goes below zero!
qplot(data=sites, x, y, main="Site 349")
(p <- qplot(data = sites, x, y, xlab = "", ylab = ""))
(p1 <- p + geom_smooth(method = "loess",span=0.5, size = 1.5))


某些LOESS线和置信区间低于零,我想将图形限制为0和正数(因为负数没有意义)。


我怎样才能做到这一点?

最佳答案

我赞同马特·帕克的建议,即您必须更改安装程序。通常仅适用于正数数据的一种选择是在对数刻度上进行拟合,然后取幂以得到原始刻度上的结果。这将保证只有正值。

生成具有以下一些问题的随机数据:

 d <- data.frame(x=0:100)
 d$y <- exp(rnorm(nrow(d), mean=-d$x/40, sd=0.8))
 qplot(x,y,data=d) + stat_smooth()


现在,我们可以使用ggplot的转换功能对y值进行对数转换,但以指数级显示结果(与原始值相对应):

qplot(x,y,data=d) + stat_smooth() + scale_y_log10()+coord_trans(ytrans="pow10")


您可以在coord_trans帮助页面上看到类似的示例。如果您不喜欢y轴,则可以操纵中断和标签。

根据问题更新进行编辑

自最初提出问题以来,ggplot2中已有一些更改,并且原始答案未处理0。

选项1

解决方案的主要思想是相同的:找到一个将可能值范围映射到-Inf到Inf的变换,在该处进行黄土平滑处理,然后对结果进行反变换。如果没有零,则对数转换会很好。我不认为如果包含0则不存在所需的函数,但是log(1+x)转换通常是可行的。那是内置的,但是我们也需要逆变换exp(x)-1

library(scales)
#create exp(x)-1 transformation, the inverse of log(1+p)
expm1_trans <-  function() trans_new("expm1", "expm1", "log1p")

qplot(x, y, data=sites) + stat_smooth(method="loess") +
  scale_y_continuous(trans=log1p_trans()) +
  coord_trans(ytrans=expm1_trans())




选项2

第二种选择是将评论中的建议扩展到Matt Parker的答案:使用包含结果整数性质的回归方法。这意味着计数过于分散(以防万一)的泊松回归。虽然您不能做黄土,但可以进行样条拟合。您可以玩自由度来控制平滑度。

library(splines)
qplot(x, y, data=sites) + stat_smooth(method="glm", family="quasipoisson",
                                      formula = y ~ ns(x, 3))




这两个选项给出的结果非常相似,这是一件好事。

关于r - 在ggplot中将y中的y限制为> 0,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/2777053/

10-12 17:36