Urllib是Python提供的一个用于操作URL的模块,在Python2.X中,有Urllib库,也有Urllib2库,在Python3.X中Urllib2合并到了Urllib中,我们爬取网页的时候,经常需要用到这个库。下面总结了Urllib相关模块中从Python2.X到Python3.X的常见的一些变动。

  

在Python2.X中使用import urllib2——对应的,在Python3.X中会使用import urllib.request,urllib.error。

在Python2.X中使用import urllib——对应的,在Python3.X中会使用import urllib.request,urllib.error,urllib.parse。

在Python2.X中使用import urlparse——对应的,在Python3.X中会使用import urllib.parse。

在Python2.X中使用import urllib2——对应的,在Python3.X中会使用import urllib.request,urllib.error。

在Python2.X中使用urllib2.urlopen——对应的,在Python3.X中会使用urllib.request.urlopen。

在Python2.X中使用urllib.urlencode——对应的,在Python3.X中会使用urllib.parse.urlencode。

在Python2.X中使用urllib.quote——对应的,在Python3.X中会使用urllib.request.quote。

在Python2.X中使用cookielib.CookieJar——对应的,在Python3.X中会使用http.CookieJar。

在Python2.X中使用urllib2.Request——对应的,在Python3.X中会使用urllib.request.Request
  

05-11 18:30