我对GPU编程非常陌生,我计划通过Python中的pyopencl访问GPU。

不幸的是,对该主题的支持不多,在深入探讨该主题之前,我认为向专家咨询他们的经验可能是个好主意。

我打算解决GPU上的最大熵方程。我要这样做的方法是每次输入不同的代码时都要运行代码1000次。

如果有人能为我指出正确的方向,我将不胜感激。

谢谢

最佳答案

正如其他人已经评论过的那样:是(py)OpenCl是这项工作的“完美”工具。

我建议您看一下示例,以了解一切的工作原理。
https://github.com/pyopencl/pyopencl/blob/master/examples

pyOpenCL作者的this幻灯片也很不错。

一个简短的示例(不导入,也不添加here中的注释)

# Create some random test data
a_np = np.random.rand(50000).astype(np.float32)
b_np = np.random.rand(50000).astype(np.float32)

# Select a device
ctx = cl.create_some_context(interactive=True)
queue = cl.CommandQueue(ctx)

# Allocate memory on the device and copy the content of our numpy array
mf = cl.mem_flags
a_g = cl.Buffer(ctx, mf.READ_ONLY | mf.COPY_HOST_PTR, hostbuf=a_np)
b_g = cl.Buffer(ctx, mf.READ_ONLY | mf.COPY_HOST_PTR, hostbuf=b_np)

# The code running on your device
prg = cl.Program(ctx, """
__kernel void sum(
    __global const float *a_g, __global const float *b_g, __global float *res_g)
{
  int gid = get_global_id(0);
  res_g[gid] = a_g[gid] + b_g[gid];
}
""").build()

# Allocate the output buffer on the device
res_g = cl.Buffer(ctx, mf.WRITE_ONLY, a_np.nbytes)
# and call the above defined kernel
prg.sum(queue, a_np.shape, None, a_g, b_g, res_g)

# Create a numpy array for the results and copy them from the device
res_np = np.empty_like(a_np)
cl.enqueue_copy(queue, res_np, res_g)

关于python - 使用pyopencl进行GPU编程,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/35421072/

10-09 19:53