本文介绍了如何在Pyopencl中明确设置做功尺寸?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

用C++编写OpenCL主机程序时,我们使用以下接口调用OpenCL内核:

cl_int clEnqueueNDRangeKernel (     cl_command_queue command_queue,
    cl_kernel kernel,
    cl_uint work_dim,
    const size_t *global_work_offset,
    const size_t *global_work_size,
    const size_t *local_work_size,
    cl_uint num_events_in_wait_list,
    const cl_event *event_wait_list,
    cl_event *event)

这里的第三个参数设置工作维度。在使用pyopencl的python中,我们将内核作为程序的一部分调用为:

<program_name>.<kernel_name>( <command_queue>, <Global_work_size>,
                              <Local_work_size>, <Parameters_to_kernel.....> )

例如:

event = program.square( queue, A.shape, None,
                        A_buf, B_buf, cl.LocalMemory( A.size), np.int32(COUNT) )

那么如何使用pyopencl在python中显式设置"work_dim"呢?

推荐答案

不需要。work_dim传入C/C++OpenCL API,以便库知道一维数组global_work_offset等的大小;在PyOpenCL中,这些大小是从作为global_sizelocal_sizeglobal_offset传递的对象推断出来的。

这篇关于如何在Pyopencl中明确设置做功尺寸?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

05-24 19:23