我正在使用uima为xml构建一个文本提取器。因为我是uima框架的初学者,所以我想知道如何去做。
我知道uima可以注释文件的特定部分,但如何有效地提取信息?如有任何帮助,我们将不胜感激。
谢谢,
杰定

最佳答案

UIMA Ruta开发人员的有限视角下,我将uima ruta的HtmlAnnotator用于这些用例。这当然不是最有效的方法。分析引擎不会对元素使用单独的类型,因为它只知道最常见的html标记,但是如果需要,我会在uima ruta中执行到预定义类型系统的转换。在后端应用htmlparser

关于xml - 使用UIMA从XML文件提取文本,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/22836546/

10-08 23:22