我需要使用Java在2个特定单词之间匹配并用正斜杠/替换反斜杠\。我试过了,它在正则表达式测试器https://regexr.com/474s0中工作正常,但是当我从基于Java的应用程序进行测试时却无法正常工作。得到这个错误。

org.apache.oro.text.regex.MalformedPatternException:无法识别序列(?
正则表达式尝试:(?<=<(DocumentImagePath)>.*?)(\\)(?=.*<\/(DocumentImagePath)>)

样品:

<DocumentImagePath>95230-88\M0010002F.tif\test</DocumentImagePath><DocumentImagePath>123-88\M0010002F.tif\test</DocumentImagePath><DocumentImagePath>abc-88\M0010002F.tif\test</DocumentImagePath>

任何帮助表示赞赏。

注意:我了解并非所有编译器都支持正面的外观,而是在寻找适合Java的正则表达式替代品。

最佳答案

您可以这样做(Java 9+):

String sample = "<DocumentImagePath>95230-88\\M0010002F.tif\\test</DocumentImagePath>\r\n" +
                "95230-88\\M0010002F.tif\\test\r\n" +
                "<DocumentImagePath>123-88\\M0010002F.tif\\test</DocumentImagePath>\r\n" +
                "<DocumentImagePath>abc-88\\M0010002F.tif\\test</DocumentImagePath>\r\n";

String result = Pattern.compile("<DocumentImagePath>.*?</DocumentImagePath>")
                       .matcher(sample)
                       .replaceAll(r -> r.group().replace('\\', '/'));

System.out.println(result);


输出量

<DocumentImagePath>95230-88/M0010002F.tif/test</DocumentImagePath>
95230-88\M0010002F.tif\test
<DocumentImagePath>123-88/M0010002F.tif/test</DocumentImagePath>
<DocumentImagePath>abc-88/M0010002F.tif/test</DocumentImagePath>


更新:对于Java 8和更早版本,请使用以下代码:

StringBuffer buf = new StringBuffer();
Matcher m = Pattern.compile("<DocumentImagePath>.*?</DocumentImagePath>").matcher(sample);
while (m.find())
    m.appendReplacement(buf, m.group().replace('\\', '/'));
String result = m.appendTail(buf).toString();

09-08 03:19