本文介绍了布朗语料库在基于WordNet的语义相似度测量中有什么用的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我遇到了几种使用WordNet的结构和层次结构来衡量语义相似性的方法,例如Jiang和Conrath度量(JNC),Resnik度量(RES),Lin度量(LIN)等.
I came across several methods for measuring semantic similarity that use the structure and hierarchy of WordNet, e.g. Jiang and Conrath measure (JNC), Resnik measure(RES), Lin measure (LIN) etc.
使用NLTK进行测量的方式是:
The way they are measured using NLTK is:
sim2=wn.jcn_similarity(entry1,entry2,brown_ic)
sim3=entry1.res_similarity(entry2, brown_ic)
sim4=entry1.lin_similarity(entry2,brown_ic)
如果WordNet是计算语义相似度的基础,那么布朗语料库在这里有什么用?
If WordNet is the basis of calculating semantic similarity, what is the use of Brown Corpus here?
推荐答案
具体来说,* _ic表示法是信息内容.
Specifically, the *_ic notation is information content.
有关信息内容的更多信息,来自此处:
A bit more info on information content from here:
这篇关于布朗语料库在基于WordNet的语义相似度测量中有什么用的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!