我将Stanford POS tagger与GATE Twitter model一起使用,并且标记器需要大约3秒钟来初始化,这是正常现象还是我加载不正确?
小样本代码:
package tweet.nlp.test;
import edu.stanford.nlp.tagger.maxent.MaxentTagger;
public class TweetNLPTest {
public static void main(String[] args) {
String text = "My sister won't tell me where she hid my food. She's fueling my anorexia. #bestsisteraward #not 😭💀";
MaxentTagger tagger = new MaxentTagger("models/gate-EN-twitter.model");
String taggedText = tagger.tagString(text);
}
}
输出:
从models / gate-EN-twitter.model读取POS标记器模型...
警告:未设置语言,未指定开放式标签,并且没有
指定的封闭类标签;假设所有标签都是开放类标签
完成[3.1秒]。
My_PRP $ sister_NN不会_MD告诉_VB me_PRP哪里_WRB
she_PRP隐藏_VBD my_PRP $食物。_NN她的_VBZ加油_VBG my_PRP $
厌食症._NN#最佳姐妹奖_HT#不_HT😭💀_HT建立成功
(总时间:3秒)
最佳答案
对我来说,它看起来很正常,初始化大约需要2到3秒钟。 .tagger
与.model
相同。
您可以在Stanford Tagger提供的示例模型中看到它:
model = wsj-0-18-bidirectional-nodistsim.tagger
关于java - 带有GATE Twitter模型的Stanford POS标记器运行缓慢,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/26689133/