我在将SUTime设置为随附的西班牙语版本时遇到了麻烦
stanford-spanish-corenlp-2018-10-05-models.jar

在斯坦福大学的文档中,它表示选项ner.applyNumericClassifiers = true
ner.useSUTime = true仅对英语版本有效,但是西班牙jar附带了spanish.sutime.txt,我希望它能正常工作。

我尝试使用以下代码:

Properties props = new Properties();
props.put("annotators", "tokenize, ssplit, pos, lemma, ner");

props.setProperty("tokenize.language", "es");
...
...
props.setProperties("sutime.rules", "edu/stanford/nlp/models/sutime/spanish.sutime.txt");


我真的不知道该如何进行下去,也没有在其他任何问题上见过这个问题,也许有人可以帮助我。

最佳答案

西班牙语将默认运行3.9.2运行SUTime。您可以使用以下属性:

ner.model = edu/stanford/nlp/models/ner/spanish.ancora.distsim.s512.crf.ser.gz
ner.applyNumericClassifiers = true
ner.useSUTime = true
ner.language = es


您可以使用以下方法获取默认的西班牙语属性:

Properties props = LanguageInfo.getLanguageProperties("spanish");

09-30 11:05