作为学习 plyr 的练习,我尝试制作 Rob Hyndman 最近发布的 plyr 版本:

library(forecast); library(plyr)
# Hyndman, R. J. (2013, Jan 7). Batch forecasting in R
# Retrieved Jan 8, 2013, from Research Tips: http://robjhyndman.com/researchtips/batch-forecasting/

retail <- read.csv("http://robjhyndman.com/data/ausretail.csv",header=FALSE)
retail <- ts(retail[,-1],f=12,s=1982+3/12)

ns <- ncol(retail)
h <- 24
fcast <- matrix(NA,nrow=h,ncol=ns)
for(i in 1:ns)
  fcast[,i] <- forecast(retail[,i],h=h)$mean

write(t(fcast),file="retailfcasts.csv",sep=",",ncol=ncol(fcast))

但是,我一直在挣扎。这是我的尝试:
n.cols <- ncol(retail)
h <- 24
series.names <- names(retail[,2:n.cols])

fcast.func <- function(retail) {
  retail.ts <- ts(retail,f=12,s=1982+3/12)
  fcast.func <- forecast(retail.ts,h=h)$mean
}

ddply.fcast <- ddply(.data=retail[,2:n.cols], .variables=series.names, .fun=colwise(fcast.func))

不返回任何值。有人可以帮助我解决我对 plyr 的误解吗?

最佳答案

问题是您使用 ddply( ,其中第一个 d = datatype of input = data.frame 和第二个 d = datatype of output = data.frame (again) 。但是,您提供的输入 retail[, 2:ncols] 不是 data.frame

class(retail)
[1] "mts" "ts"

相反,您可以做的是 ldply ,它将 list 作为输入,运行您的函数并尝试输出 data.frame 。你可以通过这种方式完成。
require(forecast)
require(plyr)

retail <- read.csv("http://robjhyndman.com/data/ausretail.csv",header=FALSE)
retail <- ts(retail[,-1],f=12,s=1982+3/12)

ns <- ncol(retail)
h <- 24
plyr.fcast <- t(ldply(1:ns, function(idx) {
    c(forecast(retail[, idx], h = h)$mean)
}))

这需要相当多的时间。如果您想并行运行(假设您在具有许多内核的集群/机器上运行),那么您可以安装 doMC 包,然后按如下方式使用它:
require(doMC)
registerDoMC(20) # BEWARE: use it if you have 20 processors available!!
plyr.fcast <- t(ldply(1:ns, function(idx) {
    c(forecast(retail[, idx], h = h)$mean)
}, .parallel = TRUE))

转置给出的结果等于 fcast 并且还将 data.frame 输出从 plyr 类型转换为 matrix 。因此,您可以使用相同的 write 语法写入文件。

希望这可以帮助。

关于r - 用于生成预测的 Plyr,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/14257500/

10-12 17:09