我发现WordNet的动词层次结构有一些问题。
例如,
a.lowest_common_hypernyms(wn.synset('love.v.02'))返回[]
动词不是也有一个共同的祖先吗?
动词甚至与同一层次的名词有联系吗?

最佳答案

要查找任何synset的顶部超名称,请使用Synset.root_hypernyms()函数,例如:

>>> from nltk.corpus import wordnet as wn
>>> wn.synsets('car')[0].root_hypernyms()
[Synset('entity.n.01')]
>>> wn.synsets('love')[0].root_hypernyms()
[Synset('entity.n.01')]
>>> wn.synsets('love', 'v')[0].root_hypernyms()
[Synset('love.v.01')]

似乎没有覆盖所有verbs的总括/伞形超名词,不像nouns覆盖的entity.n.01
>>> root_hypernyms_of_nouns = Counter(chain(*[ss.root_hypernyms() for ss in wn.all_synsets(pos='n')]))
>>> len(root_hypernyms_of_nouns)
1
>>> root_hypernyms_of_nouns.items()
[(Synset('entity.n.01'), 82115)]

但是你可以尝试遍历所有动词,例如:
wn.all_synsets(pos='v')

试着找出动词的最上面的超名词(这将是一个相当大的列表):
>>> from collections import Counter
>>> from itertools import chain
>>> from collections import Counter
>>> root_hypernyms_of_verbs = Counter(chain(*[ss.root_hypernyms() for ss in wn.all_synsets(pos='v')]))
>>> root_hypernyms_of_verbs.most_common(10)
[(Synset('change.v.01'), 1704), (Synset('change.v.02'), 1295), (Synset('act.v.01'), 1083), (Synset('move.v.02'), 1027), (Synset('make.v.03'), 659), (Synset('travel.v.01'), 526), (Synset('think.v.03'), 451), (Synset('transfer.v.05'), 420), (Synset('move.v.03'), 329), (Synset('connect.v.01'), 262)]
>>> root_hypernyms_of_verbs.keys() # This will return all root_hypernyms.

Visuwords有一个非常漂亮的交互式图形,您可以使用它手动查看WordNet层次结构,http://visuwords.com/entity

关于python - NLTK WordNet动词层次结构,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/36060492/

10-10 08:44