下载整个CRAN信息库需要多少空间?保持所有文件的压缩状态,存放所有软件包的文件夹的大小将是多少?我找不到这个问题的明确答案。我读过大约3GB,但我也碰到过200GB。

最佳答案

根据我的评论:

rsync -rtlzv --delete  cran.r-project.org::CRAN/bin/macosx/mavericks/contrib/3.2/ /cran/bin/macosx/mavericks/contrib/3.2/
rsync -rtlzv --delete  cran.r-project.org::CRAN/bin/macosx/mavericks/contrib/3.3/ /cran/bin/macosx/mavericks/contrib/3.3/
rsync -rtlzv --delete  cran.r-project.org::CRAN/doc/ /cran/doc/
rsync -rtlzv --delete  cran.r-project.org::CRAN/bin/macosx/tools/ /cran/bin/macosx/tools/
rsync -rtlzv --delete  cran.r-project.org::CRAN/web/ /cran/web/
rsync -rtlzv --delete  cran.r-project.org::CRAN/src/ /cran/src/
rsync -tlzv --delete  -a --include="NEWS" --include="*.shtml" --include="*.html" --include="*.pkg" --include="*.dmg" --include="*.gz" --exclude="*" cran.r-project.org::CRAN/bin/macosx/ /cran/bin/macosx/
rsync -tlzv --delete  -a --include="*.html" --include="*.shtml" --include="*.svg" --include="*.png" --exclude="*" cran.r-project.org::CRAN/ /cran/
rsync -rtlzv --delete  cran.r-project.org::CRAN/src/contrib/PACKAGES.gz /cran/src/contrib/PACKAGES.gz

(这不是rsync语句的优化集合)为我提供了功能非常齐全的本地CRAN存储库,该存储库很好地支持了我的所有系统。我让我保留用于测试的唯一的,几乎没有用的Windows VM使用RStudio的镜像,因为在该系统上它没有用处,但是在涉及pkgs时,我的linux和macOS系统可以完美地使用它。

正如我在评论中说的那样,该容量不足60GB。

为了使其完全正常运行,您必须设置一个Web服务器,并且使用Apache以外的其他任何东西都是PITA,因为1990年的Web技术设置CRAN似乎决定维护它。所述配置是留给读者的练习。

值得注意的是:值得花时间做镜像并探索文件系统周围的块。从1990年代网站上的HTML文件开始,您将无法获得许多用于“会计”的RDS文件和其他见解。

使用您自己的本地镜像可以减少信息泄漏,并阻止您参与GitHub README.md徽章上显示的(IMO非常不准确)“#downloads”软件包计数,并为那些未遵循的镜像保留您的隐私权不保留日志或挖掘您的pkg使用情况。

关于r - 下载整个CRAN信息库需要多少空间?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/39649849/

10-12 19:14