如何在使用CUDA时测量每个块的执行时间

如何在使用CUDA时测量每个块的执行时间