我正在尝试使用NSight Visual Studio探查器探查以下内核:
__global__ void cuMultiplyMatricesStandard(float* A, float* B, float* C, int matrixSize)
{
int gridsPerMatrixX = (matrixSize + (blockDim.x*gridDim.x) - 1)/(blockDim.x*gridDim.x);
int gridsPerMatrixY = (matrixSize + (blockDim.y*gridDim.y) - 1)/(blockDim.y*gridDim.y);
for (int i = 0; i < (gridsPerMatrixX * gridsPerMatrixY); i++)
{
int row = (blockIdx.y * blockDim.y + threadIdx.y) + (i/gridsPerMatrixX)*gridDim.y*blockDim.y;
int col = (blockIdx.x * blockDim.x + threadIdx.x) + (i%gridsPerMatrixX)*gridDim.x*blockDim.x;
if (row >= matrixSize || col >= matrixSize) continue;
float Clocal = 0;
for (int k = 0; k < matrixSize; k++)
Clocal += A[row*matrixSize + k]*B[k*matrixSize + col];
C[row*matrixSize + col] = Clocal;
}
}
如果重要,调用代码位于http://pastebin.com/kB7c7s9W下。
当我在没有配置文件的NSight调试器下运行应用程序时,它运行良好(“ P”代表“通过”,“ F”代表“失败”):
P P P P P P P
P P P P P P P
P P P P P P P
P P P P P P P
P P P P P P P
P P P P P P P
P P P P P P P
Press any key to continue . . .
但是,当我尝试通过“ NSIGHT->启动性能分析”选项(使用任何实验配置)来分析CUDA应用程序时,它崩溃了:
Nsight: Profiling CUDA Kernel cuMultiplyMatricesStandard on device [0] GeForce GTX 760
Nsight: Saving Pinned Host Memory 0 allocations 0.0 MB
Nsight: Saving Device Memory 3 allocations 0.0 MB
Nsight: Dependency Analysis ( 1/ 9):.
Nsight: Memory Global ( 2/ 9):
Nsight: Experiments complete, total replays needed: 1
CUDA ERROR IN LINE 83 OF FILE C:/Users/Maciej/Documents/Visual Studio 2012/Projects/CUDA-PR/CUDA-PR/Main.cu: unknown error (30)
CUDA ERROR IN LINE 86 OF FILE C:/Users/Maciej/Documents/Visual Studio 2012/Projects/CUDA-PR/CUDA-PR/Main.cu: unknown error (30)
F F F F F F F
F F F F F F F
F F F F F F F
F F F F F F F
F F F F F F F
F F F F F F F
F F F F F F F
Press any key to continue . . .
第83行是内核调用,第86行是后续的cudaMemcpy。然后,探查器抱怨没有注册任何内核启动,并且我没有任何数据。发生了什么?
最佳答案
Nsight 3.1在CUDA Profiler依赖关系分析实验中存在一个错误,导致某些内核在下次重放时崩溃。更新到最新版本的Nsight可以解决此问题。
关于c++ - NSight探查器使应用程序崩溃,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/21117225/