我正在尝试构建一个本质上必须执行命名实体识别(NER)的NLP应用程序。我碰到GATE。据我了解,这是一个构建NLP应用程序的框架。我测试了ANNIE,它是随GATE一起发布的IE系统,但我的域的NER结果未达到预期。事实上,任何NER(例如Stanford CoreNLP或NLTK)都没有给我所需的结果。因此,我决定调整现有系统以获得所需的结果。
关于门,我喜欢几件事:
1.组件的模块化:例如,在ANNIE中,可以彼此独立使用诸如Tokenizer,Gaztteer,Sentence splitter,POS tagger等组件。
2.它的规则语言称为JAPE,它具有很好的编写规则或模式的方式。
但是我想知道的关于GATE的几件事是:
1. GATE尤其对于NER的其他主要优势是什么?
2. GATE添加新组件的灵活性如何?例如,某天是否要在GATE中使用NLTK的POS标记器?
3.如果我想在GATE中使用自定义机器学习模型?
4.我知道谢菲尔德大学的NLP小组参与了GATE,但是我想知道GATE社区的活跃程度以及对GATE的支持有多活跃?
5. GATE可以用于商业软件吗?
热衷于此的实际使用GATE的人的建议
最佳答案
虽然晚了,但对某人可能有用。
关于java - NATE的GATE有多好?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/42417481/