我以前没有使用过分布式计算,但我正在尝试将 mpi4py 集成到程序中,以便在计算集群上并行化 for 循环。

这是我想要做的伪代码:
for file in directory: Initialize a class Run class methodsConglomerate results
我已经查看了堆栈溢出的所有内容,但找不到任何解决方案。有什么办法可以简单地使用mpi4py来做到这一点,或者有没有其他工具可以通过简单的安装和设置来做到这一点?

最佳答案

为了使用 MPI4Py 实现 for 循环的并行性,请检查下面的代码示例。
它只是一个 for 循环来添加一些数字。 for 循环将在每个节点中执行。每个节点都将获得不同的数据块来处理(for 循环中的范围)。
最后,排名为零的节点将添加所有节点的结果。

#!/usr/bin/python

import numpy
from mpi4py import MPI
import time

comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()

a = 1
b = 1000000

perrank = b//size
summ = numpy.zeros(1)

comm.Barrier()
start_time = time.time()

temp = 0
for i in range(a + rank*perrank, a + (rank+1)*perrank):
    temp = temp + i

summ[0] = temp

if rank == 0:
    total = numpy.zeros(1)
else:
    total = None

comm.Barrier()
#collect the partial results and add to the total sum
comm.Reduce(summ, total, op=MPI.SUM, root=0)

stop_time = time.time()

if rank == 0:
    #add the rest numbers to 1 000 000
    for i in range(a + (size)*perrank, b+1):
        total[0] = total[0] + i
    print ("The sum of numbers from 1 to 1 000 000: ", int(total[0]))
    print ("time spent with ", size, " threads in milliseconds")
    print ("-----", int((time.time()-start_time)*1000), "-----")

为了执行上面的代码,你应该像这样运行它:



在这个例子中,我们在 4 个节点上运行启用 MPI4Py 的代码,每个节点有 16 个内核(总共 64 个进程),每个 python 进程绑定(bind)到不同的内核。

可能对您有帮助的来源:
Submit job with python code (mpi4py) on HPC cluster
https://github.com/JordiCorbilla/mpi4py-examples/tree/master/src/examples/matrix%20multiplication

关于python - 使用 mpi4py 在计算集群上并行化 'for' 循环,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/50979373/

10-09 01:35