我想使用此处提供的加泰罗尼亚词干:
http://snowball.tartarus.org/algorithms/catalan/stemmer.html

但是,当我这样做时:

from nltk.stem.snowball import SnowballStemmer
stemmer = SnowballStemmer("catalan")


它说:


  不支持加泰罗尼亚语


有人可以帮我吗?我究竟做错了什么?

对于西班牙语,当我键入以下内容时它确实起作用:

from nltk.stem.snowball import SnowballStemmer
stemmer = SnowballStemmer("spanish")


非常感谢!

最佳答案

您没有做错任何事。 SnowballStemmer支持的语言位于源代码中,并且不包括加泰罗尼亚语:

class SnowballStemmer(StemmerI):

    """
    Snowball Stemmer

    The following languages are supported:
    Danish, Dutch, English, Finnish, French, German,
    Hungarian, Italian, Norwegian, Portuguese, Romanian, Russian,
    Spanish and Swedish.


在这里找到:http://www.nltk.org/_modules/nltk/stem/snowball.html

关于python - 如何使用雪球的加泰罗尼亚词根提取器?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/35946932/

10-12 20:10