我正在尝试使用cublas的cublasSaxpy
函数。
看一下代码:
#include <cublas_v2.h>
float *dev_B;
float *dev_tmp;
cublasStatus_t stat ;
cublasHandle_t handle ;
...
...
stat = cublasCreate(&handle);
if(stat != CUBLAS_STATUS_SUCCESS)
{
cout << "CUBLAS Initialization failed!" << endl;
exit(EXIT_FAILURE);
}
...
...
stat = cublasSetVector(N, sizeof(float), vB, N, dev_B, N);
if(stat != CUBLAS_STATUS_SUCCESS)
{
cout << "CUBLAS setting vector failed" << endl;
exit(EXIT_FAILURE);
}
stat = cublasSetVector(N, sizeof(float), nullvec, N, dev_tmp, N);
if(stat != CUBLAS_STATUS_SUCCESS)
{
cout << "CUBLAS setting vector failed" << endl;
exit(EXIT_FAILURE);
}
...
...
stat = cublasSaxpy(handle, N, 1.0f, dev_B, 1, dev_tmp, 1);
因此,我正在使用CUDA 5.0 RC1中的eclipse nsight。我没有构建项目是因为我没有完成它,但是IDE在saxpy操作中给了我一个阅读下划线:
Invalid arguments '
Candidates are:
enum {cublas_api.h:3039} cublasSaxpy_v2(cublasContext *, int, const float *, const float *, int, float *, int)
最佳答案
在CUBLAS V2 API中,所有标量实参都是通过引用而不是通过值传递的。正确调用saxpy
将类似于:
const float alpha = 1.0f;
stat = cublasSaxpy(handle, N, &alpha, dev_B, 1, dev_tmp, 1);
文档中对此进行了明确的讨论。
关于c++ - 使用cublas saxpy时出错,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/12433620/