我正在尝试从python中的字符串中提取单词tallershorter的词干。

我做了以下事情:

>>> from nltk.stem.porter import *
>>> print(stemmer.stem('shorter'))
shorter
>>> print(stemmer.stem('taller'))
taller


由于某种原因,我没有得到tallshort这两个词。任何人都知道如何解决此问题,或者可能指导替代解决方案?

最佳答案

有一些词干。这是一个:

>>> from nltk.stem.lancaster import LancasterStemmer
>>> stemmer = LancasterStemmer()
>>> stemmer.stem('shorter')
'short'

07-24 09:51