Standford Named Entities Recognizer(NER),命名实体识别是信息提取(Information Extraction)的一个子任务,它把文字的原子元素(Atomic Element)定位和分类好,然后输出为固定格式的目录,例如: 人名、组织、位置、时间的表示、数量、货币值、百分比等。官网(http://nlp.stanford.edu/ner/

NER包含以下model:

  • 3 class model : Location, Person, Organization
  • 4 class model : Location, Person, Organization, Misc
  • 7 class model : Time, Location, Organization, Person, Money, Percent, Date

运行:

在Eclipse stanford-corenlp工程中,在包edu.stanford.nlp.ie.demo下有NERDemo类,右键点击运行运行即可,输出结果如下,用的是3class model,所以标注出了Location,Person和Organization,如需其他标注可以更换class model

Stanford CoreNLP--Named Entities Recognizer(NER)-LMLPHP

05-07 15:26