我正在建立一个网络应用程序,我需要得到所有的图像和任何flash视频,嵌入(如youtube)在一个给定的网址。我在用蟒蛇。
我在谷歌上搜索过,但没有找到任何关于这个的好信息(可能是因为我不知道这叫什么来搜索),有没有人有过这样的经验,知道怎么做?
如果有的话,我想看一些代码示例。
谢谢!
最佳答案
BeautifulSoup是一个很棒的屏幕抓取库。使用urllib2获取页面,并美化组以将其解析。以下是他们文档中的代码示例:
import urllib2
from BeautifulSoup import BeautifulSoup
page = urllib2.urlopen("http://www.icc-ccs.org/prc/piracyreport.php")
soup = BeautifulSoup(page)
for incident in soup('td', width="90%"):
where, linebreak, what = incident.contents[:3]
print where.strip()
print what.strip()
print
关于python - 如何扫描网页并获取图像和youtube嵌入?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/271855/