我正在尝试计算 R 中大型稀疏矩阵的 m 第一特征向量。使用 eigen() 是不现实的,因为这里的大意味着 N > 106。

到目前为止,我发现我应该使用 igraph 包中的 ARPACK,它可以处理稀疏矩阵。但是我不能让它在一个非常简单的(3x3)矩阵上工作:

library(Matrix)
library(igraph)

TestDiag <- Diagonal(3, 3:1)
TestMatrix <- t(sparseMatrix(i = c(1, 1, 2, 2, 3), j = c(1, 2, 1, 2, 3), x = c(3/5, 4/5, -4/5, 3/5, 1)))
TestMultipliedMatrix <- t(TestMatrix) %*% TestDiag %*% TestMatrix

然后使用 arpack() 函数的帮助示例中给出的代码来提取 2 个第一个特征向量:
func <- function(x, extra=NULL) { as.vector(TestMultipliedMatrix %*% x) }
arpack(func, options=list(n = 3, nev = 2, ncv = 3, sym=TRUE, which="LM", maxiter=200), complex = FALSE)

我收到一条错误消息:
Error in arpack(func, options = list(n = 3, nev = 2, ncv = 3, sym = TRUE,  :
  At arpack.c:1156 : ARPACK error, NCV must be greater than NEV and less than or equal to N

我不明白这个错误,因为这里的 ncv (3) 大于 nev (2),并且等于 N (3)。

我是在犯一些愚蠢的错误还是有更好的方法来计算 R 中稀疏矩阵的特征向量?

更新

此错误显然是由于带有大写/小写 NCV 和 NEV 的 arpack() 函数中的错误所致。

欢迎任何解决该错误的建议(我试图查看包代码,但它对我来说太复杂了无法理解)或以其他方式计算特征向量。

最佳答案

这里实际上没有错误,但是您将 sym=TRUE 放入 ARPACK 选项列表时犯了一个错误,但是 symarpack() 函数的参数。 IE。正确的调用是:

ev <- arpack(func, options=list(n=3, nev=2, ncv=3, which="LM", maxiter=200),
             sym=TRUE, complex = FALSE)
ev$values
# [1] 3 2
ev$vectors
#               [,1]          [,2]
# [1,] -6.000000e-01 -8.000000e-01
# [2,]  8.000000e-01 -6.000000e-01
# [3,]  2.220446e-16 -9.714451e-17

如果您对细节感兴趣,会发生什么情况,而不是对称,而是调用一般的非对称特征求解器,为此还需要 NCV-NEV >= 2。来自 ARPACK 源 (dnaupd.f):
...
c          NOTE: 2 <= NCV-NEV in order that complex conjugate pairs of Ritz
c          values are kept together. (See remark 4 below)
...

还有一些评论,仅与您的问题松散相关。 arpack() 可能很慢。它的问题在于您需要在每次迭代中从 C 代码回调到 R。请参阅此线程:http://lists.gnu.org/archive/html/igraph-help/2012-02/msg00029.html
底线是 arpack() 仅在您的矩阵向量乘积回调速度很快并且您不需要多次迭代时才有帮助,后者与矩阵的特征结构有关。

我在 igraph 问题跟踪器中创建了一个问题,以查看是否可以选择使用 C 回调,使用 Rcpp,而不是 R 回调:https://github.com/igraph/igraph/issues/491
有兴趣的可以关注这个issue。

关于r - 计算 R 中稀疏矩阵的特征向量,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/16966748/

10-13 07:14