希望这是一个相当容易回答的问题。我正在尝试在程序执行期间不断地将数据数组发送到工作进程。问题是,当我尝试加入线程时,该程序只是挂起。

我以为也许工作人员终止了,所以我不需要join,但是当我删除对join的调用时,我的程序最终挂起了。

这是我的代码片段。我试图以这种方式使用工作程序来规避大型酸洗操作,因为我之前曾遇到Queue对象的开销问题。

# Outside of the class definition if that matters here...
def RunTimeWorker(conn, timestep, total_timesteps):
  print "Start worker", timestep, total_timesteps
  while (timestep < total_timesteps):
    data = conn.recv()
    timestep = data[0]
    print timestep, "DATA [" + str(data)
 conn.close()
 print "End worker"


以及调用它的类方法:

def Execute(self):
  parent_conn, child_conn = Pipe()
  p = Process(target=RunTimeTestingWorker,args=(child_conn,0,300))
  p.start()

  for timestep in xrange(300):
    ...
    # Send required data over to worker
    toProcessArr = [timestep,300,
       # trace data
       ...,...]
    parent_conn.send(toProcessArr)
    ...
  p.join # program hangs here

  #p.join  -- program will hang at end if join is commented


在这里,我的时间步已成功更新...

Start worker 0 300
0 DATA [[0, 300, ...]
1 DATA [[1, 300, ...]
2 DATA [[2, 300, ...]
...
299 DATA [[299, 300, ...] # max timesteps are 300




编辑

正如David正确指出的那样,这对我来说是一个愚蠢的错误。但是,他关于添加哨兵的评论非常有价值。

最佳答案

这是因为您的工作人员正在等待timestep < total_timesteps,其中total_timesteps = 300timestep = 299(因为timestepxrange(300)中,它是0..299)。

更好的模式是在处理完成后发送某种类型的哨兵值。例如,将工作程序更改为:

while True:
    data = con.recv()
    if data == "DONE":
        break


然后在生产者上:

parent_conn.send("DONE")
p.join()

07-24 14:11