我正在尝试使用雪在R中运行并行作业。我已经能够运行非常相似的工作,而在旧版本的R和snow上却没有遇到任何麻烦。 R软件包依赖关系阻止我还原。

会发生什么:我的作业在parRapply步骤终止,即,节点第一次不得不执行除报告Sys.info()之外的任何操作。错误消息显示为:

Error in checkForRemoteErrors(val) :
3 nodes produced errors; first error: cannot open the connection
Calls: parRapply ... clusterApply -> staticClusterApply -> checkForRemoteErrors

规范: R 2.14.0,snow 0.3-8,RedHat Enterprise Linux Client 5.6版。 snow软件包基于正确的R版本构建。

详细信息:
以下代码似乎可以正常执行:
cl <- makeCluster(3)
clusterEvalQ(cl,library(deSolve,lib="~/R/library"))
clusterCall(cl,function() Sys.info()[c("nodename","machine")])

我是最终用户,而不是系统管理员,但我迫切希望就可能出问题的地方提出建议和见解。

最佳答案

出现这个神秘错误是因为在程序执行期间请求的输入文件实际上并不存在。每个节点都会尝试加载此文件,然后失败,但这只会导致“无法打开连接”消息。

这意味着几乎任何事情都可能导致“连接”错误。令人难以置信的烦人!

关于r - "Cannot open the connection"-R与雪中的HPC,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/8218525/

10-15 03:36