我将如何使用Java中的regex在一行中找到多个匹配项?
我的代码(包括正则表达式):
public static List<String> getTitles(String html) {
List<String> titles = new ArrayList<String>();
String pattern = "(.*)rel=\"bookmark\">(.*)</a></h2>";
Pattern p = Pattern.compile(pattern);
Matcher m = p.matcher(html);
while (m.find())
System.out.println(m.group(2));
return titles;
}
我在其中使用的部分字符串:
... title="Permalink to Jet Racing Extreme – Alpha Download" rel="bookmark">Jet Racing Extreme – Alpha Download</a></h2><div class="entry-meta"> Posted on <a ...
这适用于第一次出现(实际上是整个字符串),但是由于认为整个字符串是第一次出现,因此不再赘述。
希望您能理解我想说的内容,但我不知道该如何解释得更清楚。
- 编辑
我也尝试过用以下方法替换正则表达式:
rel="bookmark">(.*)</a></h2>
我认为这样做只会将一个行字符串的一部分视为一种情况,从而解决了我的问题。但是,不是只采取:
rel="bookmark">Jet Racing Extreme – Alpha Download</a></h2>
发生时,它还需要承受一切吗?
rel="bookmark">Jet Racing Extreme – Alpha Download</a></h2><divclass="entry-meta"> Posted on <ahref="http://www.alphabetagamer.com/jet-racing-extreme-alpha-download/" title="7:29 pm" rel="bookmark"> ...
最佳答案
String pattern = "rel=\"bookmark\">(.*?)</a></h2>";
^^
让他们不贪心。