我正在使用Stanford Parser运行一个小型测试应用程序。

解析器正确地识别诸如“ 1990”,“一个”,“两个”,“三个”之类的基数。我正在寻找一种方法来检索带注释的文本的整数值。显然,这对于最初不由“一”,“二”等数字组成的文本特别有用。

是否有内置功能?

最佳答案

解析器不包含类似内容,但CoreNLP实际上具有这种功能。

您可以将以下函数应用于每个句子的CoreMap对象,从而将NumerizedTokensAnnotation添加到句子中,并将NumericValueAnnotation添加到每个标记中。

NumberNormalizer.findAndAnnotateNumericExpressions(sentence);


不幸的是,没有关于此功能的任何文档,但是您可以查看NumberNormalizer的来源,其中至少包含一些注释和解释。

10-04 20:16