不同的内核不同的架构

不同的内核不同的架构

本文介绍了不同的内核不同的架构的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我想知道是否有一些简单的方法,为不同的架构有不同版本的内核。是他们的一个简单的方法吗?或者唯一的可能性是在独立文件中定义独立的内核,并要求nvcc编译为每个文件不同的体系结构?

I am wondering if there is some easy way as to have different versions of a kernel for different architectures. Is their an easy way? or the only possibility is to define independent kernels in independent files and ask nvcc to compile to different architecture per file?

推荐答案

可以通过编译器指令来实现。像

You can do that by compiler directives. Something like

__global__ void kernel(...) {

# if __CUDA_ARCH__ >= 350

    do something

# else

    do something else

# endif

}

这篇关于不同的内核不同的架构的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

09-03 11:19