我是python的新手。我的问题与将基于index[0]的数据附加到一组文档(例如doc1,doc2)有关。

g = [('elsiescdesign', 'flowers', 6),('elsiescdesign', 'running', 6), ('fulviomeloni', 'flowers', 1), ('connor-burrows', 'flowers', 1), ('withoutroots', 'flowers', 1), ('thegreenraven', 'flowers', 2), ('taylor-music', 'flowers', 2), ('eda11y', 'flower', 7), ('2liice', 'flower', 1)]


上面是示例数据:[(blogger,tag,countsoftagusedbyblooger)]

我想将所有博客标签附加到文档中,例如

elsiescdesign =['flowers','flowers','flowers','flowers','flowers','flowers','running','running','running','running','running','running']


但是,不仅对于一个博客作者,还是这里的所有博客作者。这样做的原因是为了建立主题模型。

最佳答案

尝试这个

bloggers = {}
for b in g:
    bloggers.setdefault(b[0], []).extend([b[1]] * b[2])

07-26 05:56