我正在尝试从其online pokedex处抓取口袋妖怪信息,但是我在使用findAll()功能时遇到了麻烦。我有:

containers = page_soup.findAll("div",{"class":"pokemon-info"})


但是我不确定这个div是否是我需要查看的地方,因为(参见照片html)这个divli内部,所以也许我应该在其中搜索,例如所以:

 containers = page_soup.findAll("li", {"class":"animating"})


但是在两种情况下,当我使用len(containers)时,即使有多个条目,返回的长度也始终为0。

我也尝试过find_all(),但是len()的结果是相同的。

最佳答案

问题在于BeautifulSoup无法阅读javascript。正如furas所说,您应该打开网页并关闭javascript(here's how),然后查看是否仍然可以访问所需的内容。如果不能,则需要使用Selenium之类的控件来控制浏览器。

关于python - python web scraping-len(containers)始终返回0,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/55736971/

10-10 00:24