我在将SUTime设置为随附的西班牙语版本时遇到了麻烦
stanford-spanish-corenlp-2018-10-05-models.jar
在斯坦福大学的文档中,它表示选项ner.applyNumericClassifiers = true
和ner.useSUTime = true
仅对英语版本有效,但是西班牙jar附带了spanish.sutime.txt,我希望它能正常工作。
我尝试使用以下代码:
Properties props = new Properties();
props.put("annotators", "tokenize, ssplit, pos, lemma, ner");
props.setProperty("tokenize.language", "es");
...
...
props.setProperties("sutime.rules", "edu/stanford/nlp/models/sutime/spanish.sutime.txt");
我真的不知道该如何进行下去,也没有在其他任何问题上见过这个问题,也许有人可以帮助我。
最佳答案
西班牙语将默认运行3.9.2运行SUTime。您可以使用以下属性:
ner.model = edu/stanford/nlp/models/ner/spanish.ancora.distsim.s512.crf.ser.gz
ner.applyNumericClassifiers = true
ner.useSUTime = true
ner.language = es
您可以使用以下方法获取默认的西班牙语属性:
Properties props = LanguageInfo.getLanguageProperties("spanish");