我正在使用Stanford Parser运行一个小型测试应用程序。
解析器正确地识别诸如“ 1990”,“一个”,“两个”,“三个”之类的基数。我正在寻找一种方法来检索带注释的文本的整数值。显然,这对于最初不由“一”,“二”等数字组成的文本特别有用。
是否有内置功能?
最佳答案
解析器不包含类似内容,但CoreNLP实际上具有这种功能。
您可以将以下函数应用于每个句子的CoreMap
对象,从而将NumerizedTokensAnnotation
添加到句子中,并将NumericValueAnnotation
添加到每个标记中。
NumberNormalizer.findAndAnnotateNumericExpressions(sentence);
不幸的是,没有关于此功能的任何文档,但是您可以查看
NumberNormalizer
的来源,其中至少包含一些注释和解释。