希望这是一个相当容易回答的问题。我正在尝试在程序执行期间不断地将数据数组发送到工作进程。问题是,当我尝试加入线程时,该程序只是挂起。
我以为也许工作人员终止了,所以我不需要join
,但是当我删除对join
的调用时,我的程序最终挂起了。
这是我的代码片段。我试图以这种方式使用工作程序来规避大型酸洗操作,因为我之前曾遇到Queue对象的开销问题。
# Outside of the class definition if that matters here...
def RunTimeWorker(conn, timestep, total_timesteps):
print "Start worker", timestep, total_timesteps
while (timestep < total_timesteps):
data = conn.recv()
timestep = data[0]
print timestep, "DATA [" + str(data)
conn.close()
print "End worker"
以及调用它的类方法:
def Execute(self):
parent_conn, child_conn = Pipe()
p = Process(target=RunTimeTestingWorker,args=(child_conn,0,300))
p.start()
for timestep in xrange(300):
...
# Send required data over to worker
toProcessArr = [timestep,300,
# trace data
...,...]
parent_conn.send(toProcessArr)
...
p.join # program hangs here
#p.join -- program will hang at end if join is commented
在这里,我的时间步已成功更新...
Start worker 0 300
0 DATA [[0, 300, ...]
1 DATA [[1, 300, ...]
2 DATA [[2, 300, ...]
...
299 DATA [[299, 300, ...] # max timesteps are 300
编辑
正如David正确指出的那样,这对我来说是一个愚蠢的错误。但是,他关于添加哨兵的评论非常有价值。
最佳答案
这是因为您的工作人员正在等待timestep < total_timesteps
,其中total_timesteps = 300
但timestep = 299
(因为timestep
在xrange(300)
中,它是0..299)。
更好的模式是在处理完成后发送某种类型的哨兵值。例如,将工作程序更改为:
while True:
data = con.recv()
if data == "DONE":
break
然后在生产者上:
parent_conn.send("DONE")
p.join()