每次内核启动可以在网格中创建的最大块数是多少?自此我有点困惑

现在计算能力表here表示,CUDA计算能力2.0中每个网格二元数可以有65535个块。

这是否意味着总块数= 65535 * 65535?

还是说您最多可以将65535重新排列为65536块的一维网格
还是sqrt(65535)* sqrt(65535)的2d网格?

谢谢。

最佳答案

网格的每个维度65535。在compute 1.x卡上,支持1D和2D网格。在compute 2.x卡上,还支持3D网格,因此65535、65535 x 65535和65535 x 65535 x 65535是Fermi(计算2.x)卡的限制。

08-27 13:33