我正在尝试使用cublas的cublasSaxpy函数。

看一下代码:

#include <cublas_v2.h>

float *dev_B;
float *dev_tmp;

cublasStatus_t stat ;
cublasHandle_t handle ;
...
...
stat = cublasCreate(&handle);
if(stat != CUBLAS_STATUS_SUCCESS)
{
    cout << "CUBLAS Initialization failed!" << endl;
    exit(EXIT_FAILURE);
}
...
...
stat = cublasSetVector(N, sizeof(float), vB, N, dev_B, N);
if(stat != CUBLAS_STATUS_SUCCESS)
{
    cout << "CUBLAS setting vector failed" << endl;
    exit(EXIT_FAILURE);
}

stat = cublasSetVector(N, sizeof(float), nullvec, N, dev_tmp, N);
if(stat != CUBLAS_STATUS_SUCCESS)
{
    cout << "CUBLAS setting vector failed" << endl;
    exit(EXIT_FAILURE);
}
...
...
stat = cublasSaxpy(handle, N, 1.0f, dev_B, 1, dev_tmp, 1);

因此,我正在使用CUDA 5.0 RC1中的eclipse nsight。我没有构建项目是因为我没有完成它,但是IDE在saxpy操作中给了我一个阅读下划线:
Invalid arguments '
Candidates are:
enum {cublas_api.h:3039} cublasSaxpy_v2(cublasContext *, int, const float *, const float *, int, float *, int)

最佳答案

在CUBLAS V2 API中,所有标量实参都是通过引用而不是通过值传递的。正确调用saxpy将类似于:

const float alpha = 1.0f;
stat = cublasSaxpy(handle, N, &alpha, dev_B, 1, dev_tmp, 1);

文档中对此进行了明确的讨论。

关于c++ - 使用cublas saxpy时出错,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/12433620/

10-09 05:24