我有两个清单。
列出all_text-第一个值是键,第二个含义是
组的词。
列出keyword_list-我要在一组单词中找到的关键字列表
all_text。
我的代码显示列表all_text中的所有值。
我想得到以下结果:
defaultdict(<class 'list'>, {'Z1234': ['earth'], 'Z1207': ['north']})
如何在下面修复我的代码?
from collections import defaultdict, Counter
all_text = [['Z1234', 'earth total surface area land'], ['Z1207', 'first
north university']]
keyword_list = ['earth', 'north']
dictions = defaultdict(list)
for key, sentence in all_text:
dictions[key].extend(sentence.split())
result = defaultdict(list)
for x in dictions.values():
for i in x:
for y in keyword_list:
if i in y:
result[key].extend(x)
print(result)
>>defaultdict(<class 'list'>, {'Z1207': ['first', 'north', 'university',
'earth', 'total', 'surface', 'area', 'land']})
最佳答案
这是一种方法。
from collections import defaultdict
all_text = [['Z1234', 'earth total surface area land'],
['Z1207', 'first north university']]
keyword_list = ['earth', 'north']
keyword_set = set(keyword_list)
d = defaultdict(list)
for k, v in all_text:
for w in set(v.split()) & keyword_set:
d[k].append(w)
# defaultdict(list, {'Z1207': ['north'], 'Z1234': ['earth']})
说明
不带参数的
str.split
用空格将字符串分隔成单词列表。&
是set
交集的替代语法。