我将Stanford POS taggerGATE Twitter model一起使用,并且标记器需要大约3秒钟来初始化,这是正常现象还是我加载不正确?

小样本代码:

package tweet.nlp.test;

import edu.stanford.nlp.tagger.maxent.MaxentTagger;

public class TweetNLPTest {

    public static void main(String[] args) {
        String text = "My sister won't tell me where she hid my food. She's fueling my anorexia. #bestsisteraward #not 😭💀";

        MaxentTagger tagger = new MaxentTagger("models/gate-EN-twitter.model");

        String taggedText = tagger.tagString(text);
    }
}


输出:


  从models / gate-EN-twitter.model读取POS标记器模型...
  警告:未设置语言,未指定开放式标签,并且没有
  指定的封闭类标签;假设所有标签都是开放类标签
  完成[3.1秒]。
  
  My_PRP $ sister_NN不会_MD告诉_VB me_PRP哪里_WRB
  she_PRP隐藏_VBD my_PRP $食物。_NN她的_VBZ加油_VBG my_PRP $
  厌食症._NN#最佳姐妹奖_HT#不_HT😭💀_HT建立成功
  (总时间:3秒)

最佳答案

对我来说,它看起来很正常,初始化大约需要2到3秒钟。 .tagger.model相同。

您可以在Stanford Tagger提供的示例模型中看到它:

model = wsj-0-18-bidirectional-nodistsim.tagger

关于java - 带有GATE Twitter模型的Stanford POS标记器运行缓慢,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/26689133/

10-12 17:39