每次内核启动可以在网格中创建的最大块数是多少?自此我有点困惑
现在计算能力表here表示,CUDA计算能力2.0中每个网格二元数可以有65535个块。
这是否意味着总块数= 65535 * 65535?
还是说您最多可以将65535重新排列为65536块的一维网格
还是sqrt(65535)* sqrt(65535)的2d网格?
谢谢。
最佳答案
网格的每个维度65535。在compute 1.x卡上,支持1D和2D网格。在compute 2.x卡上,还支持3D网格,因此65535、65535 x 65535和65535 x 65535 x 65535是Fermi(计算2.x)卡的限制。