我刚刚开始使用Ruta,我想写一条规则来查找char,数字和点(.)的任意组合。
(适用于Java正则表达式-([a-z0-9。] +))
例如--
abcd.03ef0.3abc
03a.bcd.03eeff903a.bc
最佳答案
类似于以下内容:
(SW | NUM | PERIOD)+{-> MyType};
或者是否还应包含大写字符:
(W | NUM | PERIOD)+{-> MyType};
如果之前没有更改,请先更改过滤设置:
Document{-> RETAINTYPE(SPACE,BREAK,MARKUP)};
为了避免重叠的匹配,您可以使用MARKONCE而不是隐式操作,附加的(否定的)条件-PARTOF(MyType),或使用GREEDYANCHORING更改匹配策略。
关于ruta - UIMA Ruta:字符和数字组合的脚本,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/24430899/