我刚刚开始使用Ruta,我想写一条规则来查找char,数字和点(.)的任意组合。

(适用于Java正则表达式-([a-z0-9。] +))

例如--

abcd.03ef0.3abc

03a.bcd.03eeff903a.bc

最佳答案

类似于以下内容:

(SW | NUM | PERIOD)+{-> MyType};

或者是否还应包含大写字符:
(W | NUM | PERIOD)+{-> MyType};

如果之前没有更改,请先更改过滤设置:
Document{-> RETAINTYPE(SPACE,BREAK,MARKUP)};

为了避免重叠的匹配,您可以使用MARKONCE而不是隐式操作,附加的(否定的)条件-PARTOF(MyType),或使用GREEDYANCHORING更改匹配策略。

关于ruta - UIMA Ruta:字符和数字组合的脚本,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/24430899/

10-08 23:22