使用Python 3,我需要从URL请求json文档。

response = urllib.request.urlopen(request)
response对象是具有readreadline方法的类似文件的对象。通常,可以使用在文本模式下打开的文件来创建JSON对象。
obj = json.load(fp)

我想做的是:
obj = json.load(response)

但是,此方法不起作用,因为urlopen以二进制模式返回文件对象。

解决方法当然是:
str_response = response.read().decode('utf-8')
obj = json.loads(str_response)

但这感觉不好...

有没有更好的方法可以将字节文件对象转换为字符串文件对象?还是我缺少urlopenjson.load的任何参数以提供编码?

最佳答案

HTTP发送字节。如果所讨论的资源是文本,则通常通过Content-Type HTTP header 或其他机制(RFC,HTML meta http-equiv等)指定字符编码。
urllib应该知道如何将字节编码为字符串,但这太幼稚了-它是一个功能强大且功能强大的非Pythonic库。

Dive Into Python 3提供有关情况的概述。

您的“解决方法”很好-尽管感觉不对,但这是正确的方法。

07-24 09:50
查看更多