我正在使用GATE NLP
处理我的文档,并且我想使用实体名称作为候选标签
在Gate中,有OpenNLP
和LingPipe
当我阅读答案表here @Shashikant Kore回答时,他说
如果您有这样一句话:“我的 friend 乔·史密斯去了沃尔玛
商店”,OpenNLP会识别两个命名实体-“乔·史密斯”和
“沃尔玛”。我无法将“Joe Smith”标签为Person和“Walmart”
作为组织。
并建议使用LingPipe
,所以我使用了Gate NLP中提供的LingPipe
像这儿
SerialAnalyserController pipeline = (SerialAnalyserController) Factory.createResource("gate.creole.SerialAnalyserController");
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.TokenizerPR"));
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.NamedEntityRecognizerPR"));
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.POSTaggerPR"));
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.SentenceSplitterPR"));
Corpus corpus = Factory.newCorpus("SegmenterCorpus");
Document document = Factory.newDocument(handler.toString());
corpus.add(document);
pipeline.setCorpus(corpus);
pipeline.execute();
但是,当我运行程序时,出现此异常
线程“主” gate.creole.ResourceInstantiationException中的异常:
没有提供模型文件!在
gate.lingpipe.NamedEntityRecognizerPR.init(NamedEntityRecognizerPR.java:55)在
gate.lingpipe.NamedEntityRecognizerPR.init(NamedEntityRecognizerPR.java:55)
没有提供模型文件的含义是什么?
抱歉,因为我要问这个问题,但我是这个领域的新手
我只是了解了ANNIE,当我用它提取POS标签时不需要任何文件
有帮助吗?
最佳答案
终于对我有用。
我在GATE GUI中尝试了File
-> Ready Made Applications
-> LingPipe
-> LingPipe IE System
。并且它已经加载好了。
工作模型是:$gatehome$plugins/LingPipe/resources/models/ne-en-news-muc6.AbstractCharLmRescoringChunker
gate.lingpipe.NamedEntityRecognizerPR
的完整相关配置为:
...
<string>modelFileUrl</string>
<gate.util.persistence.PersistenceManager-URLHolder>
<urlString>$gatehome$plugins/LingPipe/resources/models/ne-en-news-muc6.AbstractCharLmRescoringChunker</urlString>
</gate.util.persistence.PersistenceManager-URLHolder>
...
关于java - 使用LingPipe在Gate中命名实体识别,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/35684497/