我正在尝试使用自定义NER词典映射文件来制作Stanford CoreNLP。这是相当成功的。但是我仍然拥有默认的斯坦福NER实体,例如DATE,NUMBER,而我的自定义NER词典不包含这些实体。是否可以将其关闭?

示例:丰田Altis 2.0(在自定义NER词典地图文件中找到)

斯坦福大学的成绩:Toyota:NER = ORGANIZATION,Altis:NER = VEHICLE,2.0:NER = NUM​​BER

我的预期结果:Toyota:NER = ORGANIZATION,Altis:NER = VEHICLE,2.0:NER = VEHICLE

我可以输入任何属性以将其关闭以生成实体DATE和NUMBER吗?

提前致谢!

最佳答案

我设法解决了这个问题。为了防止与数字和日期相关的实体,您需要在Java代码中设置以下参数:



props.put( "ner.useSUTime","false" );//do not load the default SUTime models from Stanford
props.put( "ner.applyNumericClassifiers","false" );//do not use numeric from Stanford





感谢观看。

关于java - 斯坦福大学CoreNLP移除NUMBER个实体,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/39783195/

10-12 23:17