我是python的新手。我的问题与将基于index[0]
的数据附加到一组文档(例如doc1,doc2)有关。
g = [('elsiescdesign', 'flowers', 6),('elsiescdesign', 'running', 6), ('fulviomeloni', 'flowers', 1), ('connor-burrows', 'flowers', 1), ('withoutroots', 'flowers', 1), ('thegreenraven', 'flowers', 2), ('taylor-music', 'flowers', 2), ('eda11y', 'flower', 7), ('2liice', 'flower', 1)]
上面是示例数据:
[(blogger,tag,countsoftagusedbyblooger)]
我想将所有博客标签附加到文档中,例如
elsiescdesign =['flowers','flowers','flowers','flowers','flowers','flowers','running','running','running','running','running','running']
但是,不仅对于一个博客作者,还是这里的所有博客作者。这样做的原因是为了建立主题模型。
最佳答案
尝试这个
bloggers = {}
for b in g:
bloggers.setdefault(b[0], []).extend([b[1]] * b[2])