我在Java中找到了2个库-JWNL和JAWS。到目前为止,在我看来,这些API非常适合查找同义词集,下位词和类似内容。您是否知道使用词网检查名词是否为可数/不可数名词的工具?我的意思是,人们是否使用wordnet来完成这项任务?否则,工具是什么?

最佳答案

如果找不到简单的资源,则可以考虑构建自己的分类器。编写自己的用户定义函数。
要考虑的因素:

  • 有些英语词典会将名词标记为(U)vs(C),以表示不可数和可数,您也许可以在网上找到某个地方。
  • 您可以查看巨大语料库中的二元组,以查看名词是在可数还是不可数的意义上使用的:one boythis boythat boy,但some fooda little bit of food等。
  • 您需要考虑很多特殊情况:I'd like some coffee vs I'd like a coffee(一杯咖啡的缩写)。
    它变得复杂。

  • This SO question非常相关,尽管它不能解决您的Java请求。这个问题的所有三个答案都很好。
    希望这可以帮助。

    10-04 18:05