有点题外话,但是我想知道是否有人可以告诉我最近何时以及如何改进cor()函数?它比我记得的要快得多,并且现在的速度与HMisc包中的rcorr函数相当,后者是我对大型矩阵的替代相关函数。

感谢所有的建议:
经过一番调查后,速度的差异是由于使用use =“pairwise”标志而不是算法更改造成的。使用此选项时,速度差约为8倍。

版本2.4-2.13中R上cor()的速度是可比的。

谢谢,

伊恩

最佳答案

http://cran.r-project.org/src/base/NEWS.html简要概述了最近的更改,并说明了它们的相关性。有时在选择其他功能中可能会影响您所做工作的相关更改时很有用。快速查找cor()仅显示几件事,但是:

2.13.0

使用use =“complete.obs”的cor()和cov()的排名相关方法在删除缺失值之前计算了排名,而文档中隐含的不完整案例首先被删除。 (https://bugs.R-project.org/bugzilla3/show_bug.cgi?id=14488PR#14488)

2.11.0

现在,cor()和cov()可以测试是否使用了非数字参数,例如非bug报告https://bugs.R-project.org/bugzilla3/show_bug.cgi?id=14207PR#14207

关于performance - cor()函数如何加速?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/7795998/

10-10 14:01