我正在尝试从其online pokedex处抓取口袋妖怪信息,但是我在使用findAll()
功能时遇到了麻烦。我有:
containers = page_soup.findAll("div",{"class":"pokemon-info"})
但是我不确定这个
div
是否是我需要查看的地方,因为(参见照片html)这个div
在li
内部,所以也许我应该在其中搜索,例如所以: containers = page_soup.findAll("li", {"class":"animating"})
但是在两种情况下,当我使用
len(containers)
时,即使有多个条目,返回的长度也始终为0。我也尝试过
find_all()
,但是len()
的结果是相同的。 最佳答案
问题在于BeautifulSoup无法阅读javascript。正如furas所说,您应该打开网页并关闭javascript(here's how),然后查看是否仍然可以访问所需的内容。如果不能,则需要使用Selenium之类的控件来控制浏览器。
关于python - python web scraping-len(containers)始终返回0,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/55736971/