是否有巨大的CSV / XML或任何文件包含英语动词及其变体列表(例如,sell-> sold,sale,selling,selleree,saleee)的文件?
我想这对NLP系统很有用,但是似乎没有清单,或者这可能是我可怕的谷歌搜索技能。有人有其他线索吗?
最佳答案
考虑Catvar:
类别变化数据库(或Catvar)是未变形单词(词缀)及其类别(即词性)变体的簇的数据库。例如,单词hunger(V),hunger(N),hungry(AJ)和hungriness(N)是描述饥饿状态的一些基本概念的不同英语变体。另一个例子是开发集群:(develop(V),developer(N),developed(AJ),developing(N),developing(AJ),development(N))。