我想使用此处提供的加泰罗尼亚词干:
http://snowball.tartarus.org/algorithms/catalan/stemmer.html
但是,当我这样做时:
from nltk.stem.snowball import SnowballStemmer
stemmer = SnowballStemmer("catalan")
它说:
不支持加泰罗尼亚语
有人可以帮我吗?我究竟做错了什么?
对于西班牙语,当我键入以下内容时它确实起作用:
from nltk.stem.snowball import SnowballStemmer
stemmer = SnowballStemmer("spanish")
非常感谢!
最佳答案
您没有做错任何事。 SnowballStemmer支持的语言位于源代码中,并且不包括加泰罗尼亚语:
class SnowballStemmer(StemmerI):
"""
Snowball Stemmer
The following languages are supported:
Danish, Dutch, English, Finnish, French, German,
Hungarian, Italian, Norwegian, Portuguese, Romanian, Russian,
Spanish and Swedish.
在这里找到:http://www.nltk.org/_modules/nltk/stem/snowball.html
关于python - 如何使用雪球的加泰罗尼亚词根提取器?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/35946932/