我正在使用GATE NLP处理我的文档,并且我想使用实体名称作为候选标签
在Gate中,有OpenNLPLingPipe当我阅读答案表here @Shashikant Kore回答时,他说

如果您有这样一句话:“我的 friend 乔·史密斯去了沃尔玛
商店”,OpenNLP会识别两个命名实体-“乔·史密斯”和
“沃尔玛”。我无法将“Joe Smith”标签为Person和“Walmart”
作为组织。

并建议使用LingPipe,所以我使用了Gate NLP中提供的LingPipe
像这儿

SerialAnalyserController pipeline = (SerialAnalyserController) Factory.createResource("gate.creole.SerialAnalyserController");
        pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.TokenizerPR"));
        pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.NamedEntityRecognizerPR"));
        pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.POSTaggerPR"));
        pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.SentenceSplitterPR"));
        Corpus corpus = Factory.newCorpus("SegmenterCorpus");
        Document document = Factory.newDocument(handler.toString());
        corpus.add(document);
        pipeline.setCorpus(corpus);
        pipeline.execute();

但是,当我运行程序时,出现此异常

线程“主” gate.creole.ResourceInstantiationException中的异常:
没有提供模型文件!在
gate.lingpipe.NamedEntityRecognizerPR.init(NamedEntityRecognizerPR.java:55)在
gate.lingpipe.NamedEntityRecognizerPR.init(NamedEntityRecognizerPR.java:55)

没有提供模型文件的含义是什么?
抱歉,因为我要问这个问题,但我是这个领域的新手
我只是了解了ANNIE,当我用它提取POS标签时不需要任何文件
有帮助吗?

最佳答案

终于对我有用。

我在GATE GUI中尝试了File-> Ready Made Applications-> LingPipe-> LingPipe IE System。并且它已经加载好了。

工作模型是:$gatehome$plugins/LingPipe/resources/models/ne-en-news-muc6.AbstractCharLmRescoringChunkergate.lingpipe.NamedEntityRecognizerPR的完整相关配置为:

...
<string>modelFileUrl</string>
<gate.util.persistence.PersistenceManager-URLHolder>
  <urlString>$gatehome$plugins/LingPipe/resources/models/ne-en-news-muc6.AbstractCharLmRescoringChunker</urlString>
</gate.util.persistence.PersistenceManager-URLHolder>
...

java - 使用LingPipe在Gate中命名实体识别-LMLPHP

关于java - 使用LingPipe在Gate中命名实体识别,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/35684497/

10-09 18:30