本文介绍了布朗语料库在基于WordNet的语义相似度测量中有什么用的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我遇到了几种使用WordNet的结构和层次结构来衡量语义相似性的方法,例如Jiang和Conrath度量(JNC),Resnik度量(RES),Lin度量(LIN)等.

I came across several methods for measuring semantic similarity that use the structure and hierarchy of WordNet, e.g. Jiang and Conrath measure (JNC), Resnik measure(RES), Lin measure (LIN) etc.

使用NLTK进行测量的方式是:

The way they are measured using NLTK is:

sim2=wn.jcn_similarity(entry1,entry2,brown_ic)
sim3=entry1.res_similarity(entry2, brown_ic)
sim4=entry1.lin_similarity(entry2,brown_ic)

如果WordNet是计算语义相似度的基础,那么布朗语料库在这里有什么用?

If WordNet is the basis of calculating semantic similarity, what is the use of Brown Corpus here?

推荐答案

NLTK如何使用词网.

具体来说,* _ic表示法是信息内容.

Specifically, the *_ic notation is information content.

有关信息内容的更多信息,来自此处:

A bit more info on information content from here:

这篇关于布朗语料库在基于WordNet的语义相似度测量中有什么用的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

08-03 17:59
查看更多