我正在使用CUDA 5.5和计算能力为3.5的NVDIA GeForce GTX 780进行动态并行编程。我在内核函数中调用内核函数,但它给了我一个错误:



我究竟做错了什么?

最佳答案

你可以做这样的事情

nvcc -arch=sm_35 -rdc=true simple1.cu -o simple1 -lcudadevrt

或者

如果您有2个文件simple1.cu和test.c,则可以执行以下操作。这称为单独编译。
nvcc -arch=sm_35 -dc simple1.cu
nvcc -arch=sm_35 -dlink simple1.o -o link.o -lcudadevrt
g++ -c test.c
g++ link.o simple1.o test.o -o simple -L/usr/local/cuda/lib64/ -lcudart

cuda programming guide中也有相同的解释

关于c++ - 编译包含动态并行性的代码失败,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/19287461/

10-10 18:47