我已使用以下正则表达式在供稿中的标签中搜索图像:
var str=items.item(i).getElementsByTagName("content:encoded").item(0).text;
var patt1=/([a-z\-_0-9\/\:\.]*\.(jpg|jpeg|png|gif))/i
var urlMatch = str.match(patt1);
然后,我将在以下标记内打印到控制台urlMatch [0],urlMatch [1]和urlMatch [2]:
<![CDATA[
<p><a href="http://www.highlandradio.com/wp-content/uploads/2013/08/Emergency.jpg"><img class="alignleft size-thumbnail wp-image-56646" alt="Emergency" src="http://www.highlandradio.com/wp-content/uploads/2013/08/Emergency-150x150.jpg" width="150" height="150" /></a></p> <p><strong>The HSE has confi
]]>
这将分别返回以下3个结果:
http://www.highlandradio.com/wp-content/uploads/2013/08/Emergency.jpg,
http://www.highlandradio.com/wp-content/uploads/2013/08/Emergency.jpg,
jpg.
有人可以向我解释发生了什么吗?为什么我的名字不是150x150?这是我需要的。谢谢您的帮助
最佳答案
您将为第一个比赛获得多个组,而不是多个比赛。这就是说,urlMatch[0]
是匹配项,urlMatch[1]
是第一个捕获组(第一组括号,顺便说一句与整个匹配项相同),而urlMatch[2]
是模式中的第二组括号(您拥有包裹在文件扩展名中)。
您需要使用全局g
标志:
var patt1=/([a-z\-_0-9\/\:\.]*\.(jpg|jpeg|png|gif))/ig;
var urlMatch = str.match(patt1);
导致:
[
"http://www.highlandradio.com/wp-content/uploads/2013/08/Emergency.jpg",
"http://www.highlandradio.com/wp-content/uploads/2013/08/Emergency-150x150.jpg"
]
如果确实需要捕获组(除了所有匹配项),则必须使用
RegExp.exec()
。如果不是,则可以使用非捕获组来提高性能。请注意,在任何情况下都不需要外部括号,因此无论如何都可以省略。使用非捕获组,这看起来像:
var patt1 = /[a-z\-_0-9´\/:.]*\.(?:jpg|jpeg|png|gif)/ig;