你知道任何足够大的 lemmatizer 数据库可以为以下示例词返回正确的结果:

geese: goose
plantes: //not found

Wordnet 的形态分析器是不够的,因为它给出了以下不正确的结果:
geese: //not found
plantes: plant

最佳答案

MorphAdorner 似乎在这方面做得更好,但它仍然发现“植物”的错误结果

plantes: plante
geese: goose

也许您想使用 MorphAdorner 进行词形还原,然后针对 WordNet 检查其结果。您可以使用 WordNet API 执行查找,而无需先通过调用 findtheinfo_ds 执行词形还原。这允许您首先使用像 MorphAdorner 这样的 lemmatizer。 (如果你想使用 lemmaitzer,你需要单独调用 morph 并在它返回的引理上调用 findtheinfo_ds。)

另一方面,为此我只花了大约 5 秒钟查看 MorphAdorner,并且可能有一种方法可以消除不正确的“植物”答案,而无需使用任何其他外部资源。

10-06 07:44