当我使用urllib2.urlopen(url).read()时,读取的源代码与在Firefox中读取的源代码略有不同。
在Firefox中看到的源代码中,某些特殊字符(例如引号(“),撇号(')等)被转换为%22,%27等。

当我使用urllib2.urlopen(url).read()时,特殊字符以明文形式可读。我希望看到使用Firefox的网页的源代码,就像使用Firefox看到的那样(%22,%27等)。

谢谢你,我的英语不好意思。

最佳答案

也许是urlencoded

您可以尝试逃避结果。

data = urllib2.urlopen(url).read()
print(urllib.quote(data))

关于python - Python urllib2.urlopen(url).read()与Firefox中可见的源代码不同,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/46065229/

10-12 23:53