我正在尝试构建一个本质上必须执行命名实体识别(NER)的NLP应用程序。我碰到GATE。据我了解,这是一个构建NLP应用程序的框架。我测试了ANNIE,它是随GATE一起发布的IE系统,但我的域的NER结果未达到预期。事实上,任何NER(例如Stanford CoreNLP或NLTK)都没有给我所需的结果。因此,我决定调整现有系统以获得所需的结果。

关于门,我喜欢几件事:
1.组件的模块化:例如,在ANNIE中,可以彼此独立使用诸如Tokenizer,Gaztteer,Sentence splitter,POS tagger等组件。
2.它的规则语言称为JAPE,它具有很好的编写规则或模式的方式。

但是我想知道的关于GATE的几件事是:
1. GATE尤其对于NER的其他主要优势是什么?
2. GATE添加新组件的灵活性如何?例如,某天是否要在GATE中使用NLTK的POS标记器?
3.如果我想在GATE中使用自定义机器学习模型?
4.我知道谢菲尔德大学的NLP小组参与了GATE,但是我想知道GATE社区的活跃程度以及对GATE的支持有多活跃?
5. GATE可以用于商业软件吗?

热衷于此的实际使用GATE的人的建议

最佳答案

虽然晚了,但对某人可能有用。

  • 正如您已经提到的那样,如果有效地编写JAPE语法将非常有用。我还认为,嵌入式GATE也是我认为的另一个重要优势,因为我们可以调整我们在JAVA中想要的方式。
  • 同样,GATE Embedded可用于添加新组件,您可以在其中构建自己的插件。但是,如果您想使用Stanford工具,则可以在GATE中轻松获得。您可以即插即用。
  • GATE中已经有很多算法可用,我想它们(谢菲尔德大学)正在不断地构建它。
  • GATE support team非常活跃,您可以订阅他们的邮件列表并询问是否有问题,他们将尽快答复。
  • 我猜是这样。但是,如果您直接联系GATE team,他们会更好地答复您。
  • 关于java - NATE的GATE有多好?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/42417481/

    10-13 08:47