我有12核和28GB RAM的服务器。我正在运行两个版本的Python;一个具有多处理功能,另一个具有顺序功能。与Sequential.py相比,我希望Multiprocessing.py能够更早完成,但是与顺序代码(25sec)相比,多处理代码(120sec)要花费5倍多的时间

Multiprocessing.py

import os,multiprocessing,time
def cube(x):
    print(x**3)
    return
if __name__ == '__main__':
    jobs = []
    start = time.time()
    for i in range(5000):
        p = multiprocessing.Process(target=cube(i))
        jobs.append(p)
        p.start()
    end = time.time()
    print end - start


顺序的

import os,time
def cube(x):
    print(x**3)
    return
if __name__ == '__main__':
    start = time.time()
    for i in range(5000):
        cube(i)
    end = time.time()
    print end - start


你能帮忙吗?

最佳答案

问题在于,相对于IPC通信开销而言,要做的工作太少。

多维数据集功能不是多处理加速的理想选择。尝试一些“更有趣”的函数,例如计算1到n的立方和的函数或类似的函数:

import os, multiprocessing, time

def sum_of_cubes(n):
    return sum(x**3 for x in range(n))

if __name__ == '__main__':

    from multiprocessing.pool import ThreadPool as Pool

    pool = Pool(25)

    start = time.time()
    print(pool.map(sum_of_cubes, range(1000, 100000, 1000)))
    end = time.time()
    print(end - start)


一般规则是:


不要启动更多的池,而您的核心可以从中受益
不要传递大量数据或返回大量数据(太多的IPC负载)
在与IPC开销相关的过程中做了大量工作。

关于python - Python多处理需要更多时间,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/32020662/

10-12 23:12