我正在尝试使用自定义NER词典映射文件来制作Stanford CoreNLP。这是相当成功的。但是我仍然拥有默认的斯坦福NER实体,例如DATE,NUMBER,而我的自定义NER词典不包含这些实体。是否可以将其关闭?
示例:丰田Altis 2.0(在自定义NER词典地图文件中找到)
斯坦福大学的成绩:Toyota:NER = ORGANIZATION,Altis:NER = VEHICLE,2.0:NER = NUMBER
我的预期结果:Toyota:NER = ORGANIZATION,Altis:NER = VEHICLE,2.0:NER = VEHICLE
我可以输入任何属性以将其关闭以生成实体DATE和NUMBER吗?
提前致谢!
最佳答案
我设法解决了这个问题。为了防止与数字和日期相关的实体,您需要在Java代码中设置以下参数:
props.put( "ner.useSUTime","false" );//do not load the default SUTime models from Stanford
props.put( "ner.applyNumericClassifiers","false" );//do not use numeric from Stanford
感谢观看。
关于java - 斯坦福大学CoreNLP移除NUMBER个实体,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/39783195/