我有一个CUDA header (.cuh)文件,其中包含两个常量浮点数组。包含此头的文件有两个,一个是试图复制到此常量内存的CPP文件,另一个是试图使用此常量内存的CUDA文件。所有这三个文件都在一个应编译为DLL的项目中。

我尝试使用以下代码简化操作:

obj1.cuh

#pragma once

__constant__ float d_array1[5];
__constant__ float d_array2[5];

obj1.cu
#include "obj1.cuh"

//do random stuff
__global__ void kernel(float * d_array1, float * d_array2) {
  int id = threadIdx.x;
  float sum = d_array1[i] + d_array2[i];
}

外部文件
#include "obj1.cuh"

void function(float * array1, float * array2) {
  cudaMemcpyToSymbol(d_array1, array1, sizeof(float)*5);
  cudaMemcpyToSymbol(d_array2, array2, sizeof(float)*5);

  kernel<<<1,5>>>(d_array1,d_array2);
}

生成失败,并输出以下错误:
1>ext.obj : error LNK2005: "float * d_array1" (?d_array1@@3PAMA) already defined in obj1.cu.obj
1>ext.obj : error LNK2005: "float * d_array2" (?d_array2@@3PAMA) already defined in obj1.cu.obj

在您问之前,是的,我曾经尝试使用include防护而不是pragma,它仍然会输出相同的错误。

包括obj1.cuh的防护版本
#ifndef CONSTANTARRAYS
#define CONSTANTARRAYS
__constant__ float d_array1[5];
__constant__ float d_array2[5];
#endif

最佳答案

问题恰恰是链接程序告诉您的:变量在多个translation units中定义。

当预处理器包含头文件时,它实际上将头文件中的文本粘贴到#include指令所在的位置,这意味着两个生成的对象文件都将具有变量的定义。

您应该做的只是在头文件中声明变量,然后在单个源文件中定义它们。要将定义更改为声明,最简单的方法是在extern关键字前添加:

#pragma once

extern __constant__ float d_array1[5];
extern __constant__ float d_array2[5];

然后,在单个源文件中,您具有旧的定义:
__constant__ float d_array1[5];
__constant__ float d_array2[5];
#pragma once或 header 包含防护可防止将 header 文件多次包含在同一翻译单元中。

09-05 00:35
查看更多