本文实例讲述了Java正则提取中括号中的内容操作。分享给大家供大家参考,具体如下:

曾经在工作中遇到一个问题,就是需要提取字符串中每一个中括号里的内容,在网上搜了一下,发现用正则表达式可以提取中括号中的内容,具体实现如下:

import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class ExtractMessage {
  public static void main(String[] args) {
    String msg = "PerformanceManager[第1个中括号]Product[第2个中括号]<[第3个中括号]79~";
    List<String> list = extractMessageByRegular(msg);
    for (int i = 0; i < list.size(); i++) {
      System.out.println(i+"-->"+list.get(i));
    }
  }
  /**
   * 使用正则表达式提取中括号中的内容
   * @param msg
   * @return
   */
  public static List<String> extractMessageByRegular(String msg){
    List<String> list=new ArrayList<String>();
    Pattern p = Pattern.compile("(\\[[^\\]]*\\])");
    Matcher m = p.matcher(msg);
    while(m.find()){
      list.add(m.group().substring(1, m.group().length()-1));
    }
    return list;
  }
}

输出结果如下:

这样很快就完成了代码的工作,但是后来发现如果中括号中还包含中括号,正则表达式就失去作用了,我不得不自己想办法解决,经过研究终于招到了解决方法,具体实现如下:

package com.perry.test;
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class ExtractMessage {
  public static void main(String[] args) {
    String msg = "PerformanceManager[第1个中括号]Product[第2个中括号[中括号中包含中括号]]<[第3个中括号]79~";
    List<String> list = extractMessage(msg);
    for (int i = 0; i < list.size(); i++) {
      System.out.println(i+"-->"+list.get(i));
    }
  }
  /**
   * 提取中括号中内容,忽略中括号中的中括号
   * @param msg
   * @return
   */
  public static List<String> extractMessage(String msg) {
    List<String> list = new ArrayList<String>();
    int start = 0;
    int startFlag = 0;
    int endFlag = 0;
    for (int i = 0; i < msg.length(); i++) {
      if (msg.charAt(i) == '[') {
        startFlag++;
        if (startFlag == endFlag + 1) {
          start = i;
        }
      } else if (msg.charAt(i) == ']') {
        endFlag++;
        if (endFlag == startFlag) {
          list.add(msg.substring(start + 1, i));
        }
      }
    }
    return list;
  }
}

输出结果如下:

主要思路就是遍历字符串,在中括号的开始和结束位置做标记计数,如果是中括号开始位置对应的结束位置,那么开始位置和结束位置的计数是一致的,这样截取的就是一个完整的中括号的内容。

PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:

JavaScript正则表达式在线测试工具:
http://tools.jb51.net/regex/javascript

正则表达式在线生成工具:
http://tools.jb51.net/regex/create_reg

更多关于java算法相关内容感兴趣的读者可查看本站专题:《Java正则表达式技巧大全》、《Java数据结构与算法教程》、《Java操作DOM节点技巧总结》、《Java文件与目录操作技巧汇总》和《Java缓存操作技巧汇总

希望本文所述对大家java程序设计有所帮助。

01-31 08:27