我有一个关于 cblas_dgemv 的问题。我试图了解它是如何工作的。我可能做错了什么。我有一个矩阵矩阵,然后我尝试读取该矩阵 RowMajor 和 ColumnMajor。

我在 RowMajor 案例中得到了预期的结果; [6, 2, 4, 6]'。

但是对于 ColMajor,当答案应该是 [6, 3, 2, 3]' 时,我得到 [-7, 3, 0, 5]'

这是我的代码。我正在使用英特尔 MKL。

#include <stdio.h>
#include <stdlib.h>
#include <math.h>
#include <mkl.h>


#define NCols 5
#define Nrows 4

double A[] = { 8, 4, 7, 3, 5, 1, 1, 3, 2, 1, 2, 3, 2, 0, 1, 1 , 2, 3, 4, 1};

double x[] = { -1, 2, -1, 1, 2 };

double y[Nrows];
double alpha = 1.0, beta = 0.0;
char tbuf[1024];
int main() {
    int i, j;

    // Print original matrix

    // y = Ax
    cblas_dgemv(CblasRowMajor, CblasNoTrans, Nrows, NCols, alpha, A, NCols, x, 1, beta, y, 1);
    // Print resulting vector
    for (j = 0; j < Nrows; j++) {
        printf(" %f\n", y[j]);
    }

    cblas_dgemv(CblasColMajor, CblasNoTrans, Nrows, NCols, alpha, A, NCols, x, 1, beta, y, 1);
    // Print resulting vector
    for (j = 0; j < Nrows; j++) {
        printf(" %f\n", y[j]);
    }

    return 0;
}

最佳答案

问题出在 lda 上。从引用我们得到


CblasRowMajorCblasColMajor 描述了二维矩阵的内存存储顺序。

矩阵 CblasRowMajorA(nrow,ncol) 存储意味着首先存储矩阵 ncol 第一行的 A 值,然后存储 ncol 矩阵第二行的 A 值,依此类推。

矩阵 CblasColMajorA(nrow,ncol) 存储意味着首先存储矩阵 nrow 第一列的 A 值,然后存储 nrow 矩阵第二列的 A 值,依此类推。

因此,在 CblasRowMajor 存储中,LDA(矩阵 A 的第一维)是 ncol 而在 CblasColMajor 中是 nrow

在您的示例中,您只需更改第二个 ldacblas_dgemv

cblas_dgemv(CblasColMajor, CblasNoTrans, Nrows, NCols, alpha, A, Nrows, x, 1, beta, y, 1);

关于c++ - cblas_dgemv 的意外结果,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/30195779/

10-11 14:14