我正在从事一个项目,该项目涉及计算不同概念之间的相关性。
例子:
“登陆” - 与:“到达;来”和“着陆”有关,
“电话” - 与:“电子;电”和“谈话;沟通”有关,
“电影” - 与:“移动;改变”和“图片;图像”有关
, 等等。
我检查了 WordNet 框架和 WordNet::Similarity Perl 模块,但在某些情况下它们不可用,特别是在我需要将名词与动词连接的情况下(例如名词“狗”和动词“吠叫”) .此外,WordNet 以层次结构(例如:计算机 -> 机器 -> 设备 -> 仪器)组织所有同义词集,这并不是我在我的项目中真正需要的(当然,我可能是错的)。
问题是 - 我应该使用哪个框架或数据库,我应该使用什么方法来解决问题?我从哪里开始?
如果您能给我一些建议,那将非常有帮助。
最佳答案
word2vec 嵌入可能会很好地完成您的任务。它提供了比 wordnet 更柔和的相似性概念。您可以从 https://code.google.com/p/word2vec/ 获得一些链接的预训练嵌入。
关于nlp - 寻找不同词之间的语义相似性和关系,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/26030363/