我正在学习BeautifulSoup 4文档,并希望练习给出的示例。

我正在尝试示例,但没有成功。下面的例子。

似乎我的输入方式不正确,问题出在“ URL”上。有什么好心可以告诉我正确的放置方法吗?谢谢。

from bs4 import BeautifulSoup
import re
import urllib2


url = '<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>'

page = urllib2.urlopen(url)
soup = BeautifulSoup(page.read())

Learning = soup.find_all("a", class_="sister")

print Learning

最佳答案

'<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>'不是网址。

该代码包含html;您不需要使用urllib2.urlopen

from bs4 import BeautifulSoup

page = '<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>'
soup = BeautifulSoup(page)
Learning = soup.find_all("a", class_="sister")
print Learning

关于python - Python BeautifulSoup 4文档中给出的示例,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/21225640/

10-12 23:23