尝试使用Beautiful Soup 4在html代码中查找某些标签。有这样的标签:

<a href='obec.php?kod_obce=511226'>Ábelová</a>


在html中。

问题是,当我尝试使用re.compile时bs4找不到这些标签。

这是代码的一部分:

obce = soup.findAll("a", attrs={'href':re.compile("obec.php?kod_obce.*")})


它什么也没找到。

你知道发生了什么事吗?

最佳答案

?是正则表达式的特殊字符:它表示p或无字符。带问号的字符串将被拒绝。使用转义:

r"obec.php\?kod_obce.*"

10-06 05:19