尝试使用Beautiful Soup 4在html代码中查找某些标签。有这样的标签:
<a href='obec.php?kod_obce=511226'>Ábelová</a>
在html中。
问题是,当我尝试使用
re.compile
时bs4找不到这些标签。这是代码的一部分:
obce = soup.findAll("a", attrs={'href':re.compile("obec.php?kod_obce.*")})
它什么也没找到。
你知道发生了什么事吗?
最佳答案
?
是正则表达式的特殊字符:它表示p
或无字符。带问号的字符串将被拒绝。使用转义:
r"obec.php\?kod_obce.*"