我的问题是,我无法修改内核中的值。

这是无效的代码:

1:内核:

__kernel void GetCellIndex(__global Particle* particles) {
    int globalID = get_global_id(0);
    particles[globalID].position.x = globalID;
};


第二:内核中使用的结构:

typedef struct _Particle
{
    float3 position;
}Particle;


第三:从CPU到GPU的推动:

(Particle*) particles = (Particle*)malloc(sizeof(Particle)*200);
for (int i = 0; i < 200; i++)
{
    particles[i].position.x = 5f;
}

cl_mem cl_Particles = clCreateBuffer(context, CL_MEM_READ_WRITE |
    CL_MEM_COPY_HOST_PTR, sizeof(Particle)*maxParticle, &particles[0], NULL);



//init of kernel etc.



err = clSetKernelArg(kernel, 0, sizeof(cl_mem), (void *)&cl_Particles);
if (err != 0) {
    std::cout << "Error: setKernelArg 0 does not work!" << std::endl;
    system("Pause");
}


第四:运行内核:

size_t localItem = 1;
err = clEnqueueNDRangeKernel(queue, kernel, 1, 0, &(size_t)200+1, &localItem, 0, NULL, NULL);
if (err != 0) {
    std::cout << "Error: EnqueueNDRange does not work!" << std::endl;
}

err = clFlush(queue);
if (err != 0) {
    std::cout << "Error: Flush does not work: " << err << std::endl;
}

err = clFinish(queue);
if (err != 0) {
    std::cout << "Error: Finish does not work: " << err << std::endl;
}


第五:GPU上使用的结构:

typedef struct _Particle
{
    cl_float3 position;
}Particle;


第六:最后读取缓冲区:

clEnqueueReadBuffer(queue, cl_Particles, CL_TRUE, 0, 200 * sizeof(Particle), particles, 0, NULL, NULL);


在此步骤之后,我的内核不会影响clEnqueueReadBuffer中返回的值。

有人知道为什么吗?这里有什么问题

最佳答案

解决了问题:

将malloc行更改为类似

particles = new Particles[200];


还要将数据分步写入缓冲区(使用clEnqueueWriteBuffer(...)

其余的应该像上面的代码一样工作

关于c++ - OpenCL-无法修改值,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/34725795/

10-12 20:37