Closed. This question is off-topic。它目前不接受答案。
想改进这个问题吗?Update the question所以堆栈溢出的值小于aa>。
四年前关闭。
这是一个简单的问题,但我想以前没有人问过。
如果我有一个数据帧列表(由于多处理,它们需要采用这种格式),
是否有一种优雅的方式来附加所有这些?一班就更好了。
我希望它能对多处理模块输出有用。
想改进这个问题吗?Update the question所以堆栈溢出的值小于aa>。
四年前关闭。
这是一个简单的问题,但我想以前没有人问过。
如果我有一个数据帧列表(由于多处理,它们需要采用这种格式),
df_list=[df1,df2,...,dfn]
是否有一种优雅的方式来附加所有这些?一班就更好了。
最佳答案
下面的并行处理示例使用concat方法在IPython中工作:
from IPython import parallel
clients = parallel.Client() #a lightweight handle on all the engines of a cluster
clients.block = True # use synchronous computations
print(clients.ids)
dview = clients[:] #dview = clients.direct_view()
dview.block = True
dview.scatter("experiment", myDataFrame) # <myDataFrame> scattered as <experiment> to the engines
dview["wlist_ptrn"] = wlist_ptrn
dview.execute("experiment['allFeats'] = experiment.ttext.str.findall(wlist_ptrn)")
return pd.concat(dview.gather("experiment")) # gather method returns a list of data frames
我希望它能对多处理模块输出有用。
09-16 21:02