我有两个清单。


  列出all_text-第一个值是键,第二个含义是
  组的词。
  
  列出keyword_list-我要在一组单词中找到的关键字列表
  all_text。


我的代码显示列表all_text中的所有值。

我想得到以下结果:

defaultdict(<class 'list'>, {'Z1234': ['earth'], 'Z1207': ['north']})


如何在下面修复我的代码?

from collections import defaultdict, Counter
all_text = [['Z1234', 'earth total surface area land'], ['Z1207', 'first
north university']]
keyword_list = ['earth', 'north']

dictions = defaultdict(list)
for key, sentence in all_text:
    dictions[key].extend(sentence.split())

result = defaultdict(list)
for x in dictions.values():
    for i in x:
        for y in keyword_list:
            if i in y:
                result[key].extend(x)
print(result)

>>defaultdict(<class 'list'>, {'Z1207': ['first', 'north', 'university',
'earth', 'total', 'surface', 'area', 'land']})

最佳答案

这是一种方法。

from collections import defaultdict

all_text = [['Z1234', 'earth total surface area land'],
            ['Z1207', 'first north university']]
keyword_list = ['earth', 'north']

keyword_set = set(keyword_list)

d = defaultdict(list)

for k, v in all_text:
    for w in set(v.split()) & keyword_set:
        d[k].append(w)

# defaultdict(list, {'Z1207': ['north'], 'Z1234': ['earth']})


说明


不带参数的str.split用空格将字符串分隔成单词列表。
&set交集的替代语法。

07-24 09:51
查看更多