我正在做一个NLP项目,需要识别句子中的概念才能找到其他类似的概念。我这样做是为了从我已经拥有的列表中推断出价态。我开始使用WordNet,但结果却有许多矛盾。所谓矛盾的结果,是指具有矛盾价的词扩展。
所以现在我正在研究ConceptNet和OpenCyc。我已经实现了ConceptNet,一切都非常容易,而且我喜欢它。问题在于OpenCyc似乎具有更大,更逻辑上严格的数据库,当我在WordNet上发现如此多的“矛盾”时,这一点很重要...但是我不知道,因为我还没有尝试过。
有人可以告诉我是否值得(对于我来说相当大)来实现OpenCyc,还是ConceptNet足以推断出单词价?他们有什么不同吗?
如果需要,我很乐意进一步解释自己。尝试暂时保持简短!
谢谢!
最佳答案
这是不值得的。 ConceptNet可以更好,更轻松地进行处理。
当我使用ConceptNet时,只需下载一个sqlite数据库和一个python模块来访问其中的关系即可。对于OpenCyc,这是一个更大的下载,必须通过Web服务器进行设置,这需要花费很多时间才能加载并使用大量内存。从那以后,事情可能发生了变化,但这是我的经验。