我希望能够使用 PTX 1.3 中尚未在 C 接口(interface)中实现的功能。有没有办法在 PTX 中编写我自己的函数并注入(inject)现有的二进制文件?
我正在寻找的功能是获取 %smid
的值
最佳答案
答案:
__noinline__ __device__ uint get_smid(void)
{
uint ret;
asm("mov.u32 %0, %smid;" : "=r"(ret) );
return ret;
}
关于CUDA:注入(inject)我自己的 PTX 功能?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/2983553/