我不知道StackOverflow是否涵盖NLP,所以我来试试。
我有兴趣从特定 Realm 中找到两个词的语义相关性,即“图像质量”和“噪声”。我正在做一些研究,以确定相机的评论对于相机的特定属性是正面还是负面。 (例如每条评论中的图片质量)。

但是,并不是每个人都在帖子中使用完全相同的措辞“图像质量”,所以我要看看是否有一种方法可以构建这样的内容:

“图像质量”,包括(“噪声”,“颜色”,“清晰度”等)
所以我可以将所有东西都包裹在一把大伞中。

我正在用另一种语言执行此操作,因此Wordnet不一定有帮助。不,我不为Google或Microsoft工作,因此也没有人的点击行为数据作为输入数据。

但是,我确实有很多文本,带有位置标记,分段等。

最佳答案

查看Google相似距离-http://arxiv.org/abs/cs.CL/0412098
例如。如果很多网页都包含这两个网页,则可能是相关的。

http://mechanicalcinderella.com上的演示程序

除此之外,您可以尝试翻译wordnet之类的项目((谷歌翻译可能会有所帮助),或启动协作式本体。

关于nlp - NLP:找到单词之间语义相似性的简便方法好吗?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/2441361/

10-12 19:34