我希望能够使用 PTX 1.3 中尚未在 C 接口(interface)中实现的功能。有没有办法在 PTX 中编写我自己的函数并注入(inject)现有的二进制文件?

我正在寻找的功能是获取 %smid 的值

最佳答案

答案:

__noinline__ __device__ uint get_smid(void)
{
    uint ret;
    asm("mov.u32 %0, %smid;" : "=r"(ret) );
    return ret;
}

关于CUDA:注入(inject)我自己的 PTX 功能?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/2983553/

10-12 23:58