我是python的新手,并通过书中的示例进行练习。
谁能解释为什么当我尝试使用此代码添加示例时,什么都没有改变?
>>> from nltk.stem import PorterStemmer
>>> stemmer=PorterStemmer()
>>> stemmer.stem('numpang wifi stop gadget shopping')
'numpang wifi stop gadget shopping'
但是当我这样做的时候
>>> stemmer.stem('shopping')
'shop'
最佳答案
试试这个:
res = ",".join([ stemmer.stem(kw) for kw in 'numpang wifi stop gadget shopping'.split(" ")])
问题是,词干分析器可能只处理单个单词。您的字符串没有“根”字,而单个词“购物”具有根“店”。因此您必须分别计算词干
编辑:
从他们的源代码->
Stemming algorithms attempt to automatically remove suffixes (and in some
cases prefixes) in order to find the "root word" or stem of a given word. This
is useful in various natural language processing scenarios, such as search.
所以我想你确实是被迫自己分割字符串