我正在尝试从python中的字符串中提取单词taller
和shorter
的词干。
我做了以下事情:
>>> from nltk.stem.porter import *
>>> print(stemmer.stem('shorter'))
shorter
>>> print(stemmer.stem('taller'))
taller
由于某种原因,我没有得到
tall
和short
这两个词。任何人都知道如何解决此问题,或者可能指导替代解决方案? 最佳答案
有一些词干。这是一个:
>>> from nltk.stem.lancaster import LancasterStemmer
>>> stemmer = LancasterStemmer()
>>> stemmer.stem('shorter')
'short'