Closed. This question is off-topic。它目前不接受答案。
想改进这个问题吗?Update the question所以堆栈溢出的值小于aa>。
四年前关闭。
这是一个简单的问题,但我想以前没有人问过。
如果我有一个数据帧列表(由于多处理,它们需要采用这种格式),
df_list=[df1,df2,...,dfn]

是否有一种优雅的方式来附加所有这些?一班就更好了。

最佳答案

下面的并行处理示例使用concat方法在IPython中工作:

    from IPython import parallel
    clients = parallel.Client() #a lightweight handle on all the engines of a cluster
    clients.block = True  # use synchronous computations
    print(clients.ids)

    dview = clients[:] #dview = clients.direct_view()
    dview.block = True

    dview.scatter("experiment", myDataFrame) # <myDataFrame> scattered as <experiment> to the engines
    dview["wlist_ptrn"] = wlist_ptrn
    dview.execute("experiment['allFeats'] = experiment.ttext.str.findall(wlist_ptrn)")
    return pd.concat(dview.gather("experiment")) # gather method returns a list of data frames

我希望它能对多处理模块输出有用。

09-16 21:02