re实战记录

针对网页中的空格符

一般使用的.,但是它不能匹配\n,所以使用[\s\S]或者[\d\D]匹配所有字符

import re
l1=r'''
<div class="thumb"> <a href="/article/122164169" target="_blank"> <img src="//pic.qiushibaike.com/system/pictures/12216/122164169/medium/GFG7STTS204NYW40.jpg" alt="可怜小孩儿三秒钟">
</a> </div>'''
print(re.findall('<div class="thumb">[\d\D]*?<img src="(.*?)" alt',l1))

['//pic.qiushibaike.com/system/pictures/12216/122164169/medium/GFG7STTS204NYW40.jpg']

04-10 17:50