This question already has answers here:
How to get VS 2010 to recognize certain CUDA functions
(2个答案)
7年前关闭。
在以下示例中,Visual Studio用红线突出显示“
似乎程序执行成功,因此问题仅是VisualStudio中的显示问题。
如何使Visual Studio不再突出显示
我的环境:
*操作系统:Windows7,64bit
* VisualStudio2010,CUDA5.5
源代码:
(2个答案)
7年前关闭。
在以下示例中,Visual Studio用红线突出显示“
threadIdx
”。似乎程序执行成功,因此问题仅是VisualStudio中的显示问题。
如何使Visual Studio不再突出显示
threadIdx
为无效?我的环境:
*操作系统:Windows7,64bit
* VisualStudio2010,CUDA5.5
源代码:
#include <cuda_runtime.h>
#include <stdio.h>
#include <math.h>
#include <cuda.h>
#define N 256
__global__ void matrix_vector_multi_gpu_1_256(float *A_d, float *B_d, float *C_d);
int main(){
int i,j;
float A[N], B[N*N], C[N];
float *A_d, *B_d, *C_d;
dim3 blocks(1,1,1);
dim3 threads(256,1,1);
for(j=0;j<N;j++){
for(i=0;i<N;i++){
B[j*N+i]=((float)j)/256.0;
}
}
for(j=0;j<N;j++){
C[j]=1.0F;
}
cudaMalloc((void**)&A_d, N*sizeof(float));
cudaMalloc((void**)&B_d, N*N*sizeof(float));
cudaMalloc((void**)&C_d, N*sizeof(float));
cudaMemcpy(A_d,A,N*sizeof(float),cudaMemcpyHostToDevice);
cudaMemcpy(B_d,B,N*N*sizeof(float),cudaMemcpyHostToDevice);
cudaMemcpy(C_d,C,N*sizeof(float),cudaMemcpyHostToDevice);
matrix_vector_multi_gpu_1_256<<<blocks,threads>>>(A_d,B_d,C_d);
cudaMemcpy(A,A_d,N*sizeof(float),cudaMemcpyDeviceToHost);
for(j=0;j<N;j++){
printf("A[ %d ]=%f \n",j,A[j]);
}
getchar();
cudaFree(A_d);
cudaFree(B_d);
cudaFree(C_d);
return 0;
}
__global__ void matrix_vector_multi_gpu_1_256(float *A_d, float *B_d, float *C_d){
int i;
A_d[threadIdx.x]=0.0F;
for(i=0;i<N;i++){
A_d[threadIdx.x]=A_d[threadIdx.x]+B_d[threadIdx.x*N+i]*C_d[i];
}
}
最佳答案
尝试添加
#include <device_launch_parameters.h>
10-08 11:04