java - 从rtf字符串java中提取字符串内容

我遵循rtf字符串：\af31507 \ltrch\fcs0 \insrsid6361256 Study Title: {Test for 14431 process\'27s \u8805 1000 Testing2 14432 \u8805 8000}}{\rtlch\fcs1 \af31507 \ltrch\fcs0 \insrsid12283827，我想提取研究标题（即（Study Title: {Test for 14431 process\'27s \u8805 1000 Testing2 14432 \u8805 8000}））的内容。下面是我的代码

String[] arr = value.split("\\s+");
//System.out.println(arr.length);
for(int j=0; j<arr.length; j++) {
    if(isNumeric(arr[j])) {
         arr[j] = "\\?" + arr[j];
    }
}

在上面的代码中，我按空格对字符串进行拆分，然后遍历数组以检查字符串中是否有任何数字，但是，isNumeric函数无法处理8000，因为它得到了\u8805内容为8000}}{\rtlch\fcs1。我不确定如何使用正则表达式搜索研究标题及其内容？

最佳答案

Study Title: {[^}]*}将符合您的期望。演示：https://regex101.com/r/FZl1WL/1

    String s = "{\\af31507 \\ltrch\\fcs0 \\insrsid6361256 Study Title: {Test for 14431 process\\'27s \\u8805 1000 Testing2 14432 \\u8805 8000}}{\\rtlch\\fcs1 \\af31507 \\ltrch\\fcs0 \\insrsid12283827";
    Pattern p = Pattern.compile("Study Title: \\{[^}]*\\}");
    Matcher m = p.matcher(s);
    while (m.find()) {
        System.out.println(m.group());
    }

输出：

Study Title: {Test for 14431 process\'27s \u8805 1000 Testing2 14432 \u8805 8000}

按照OP更新

String s = "{\\af31507 \\ltrch\\fcs0 \\insrsid6361256 Study Title: {Test for 14431 process\\'27s \\u8805 1000 Testing2 14432 \\u8805 8000}}{\\rtlch\\fcs1 \\af31507 \\ltrch\\fcs0 \\insrsid12283827";
    Pattern p = Pattern.compile("(?<=Study Title: \\{)[^}]*(?=\\})");
    Matcher m = p.matcher(s);
    while (m.find()) {
        System.out.println(m.group());
    }

Test for 14431 process\'27s \u8805 1000 Testing2 14432 \u8805 8000