我正在尝试使用 Java 中的 Stanford CoreNLP v3.9.1 注释文本。
使用的注释器是:tokenize、ssplit、pos、lemma、ner

我已经包含了 https://stanfordnlp.github.io/CoreNLP/download.html 的模型 jar 。
两种英文模型都包含在我的项目中(普通 + kbp)。

但是,加载 english.muc.7class.distsim.crf.ser.gz 分类器后,会抛出以下异常: Couldn't read TokensRegexNER from edu/stanford/nlp/models/kbp/regexner_caseless.tab

打开下载的jar模型stanford-english-kbp-corenlp-2018-02-27-models.jar后,正确的regexner_caseless.tab路径是edu/stanford/nlp/models/kbp/english/regexner_caseless.tab(注意english子路径)。

如何让斯坦福 CoreNLP 使用正确的路径?

最佳答案

您缺少发行版附带的主要模型 jar。
stanford-corenlp-2018-02-27-models.jar

关于stanford-nlp - 使用 NER : Exception: couldn't read TokensRegexNER 注释文本,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/49583377/

10-13 01:56