我有一句话是说s1。我在另一个集合中也有多个字符串,比如s2,s3,s4。
我想将字符串s1中的单词与每个字符串s2、s3等匹配。基于最大相似性评分,我想找出S2、S3中哪个字符串与S1匹配最大值。
我想用wordnet的路径算法。请建议,什么是最好的方法。
最佳答案
要在wordnet中使用路径相似性,首先需要用wordnet中的语法集消除每个单词的歧义。然后可以计算两个文本基于WordNet的相似度。
在this paper中,他们使用wu-palmer路径相似度将其称为概念相似度。他们基本上把句法集看作是文本中的概念,把吴帕尔默路径相似度看作是概念相似度的度量。
如果p和q是两个文本,并且是这两个文本中对应的一组句法集,则两个文本的概念相似性计算公式如下:
这是两个synset的wu-palmer相似性。
关于algorithm - 如何使用WordNet路径算法计算两个字符串中单词的语义相似度,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/31228012/