我获取了一个包含日语的网页,但是当我将其打印到控制台时,没有得到7月10日的输出。相反,它会打印:7\xe6\x9c\x8810\xe6\x97\xa5
我该怎么办?

最佳答案

你得到的输出是正确的。这就是日本字符串的UTF-8表示。问题是控制台本身不理解utf-8。如果你把这个字符串写在一个文件中,并用一个理解utf-8的编辑器打开它,你将看到你所期望的内容。您还可以尝试将控制台的编码更改为utf-8。
编辑:您也可以尝试以下方法:

print '7\xe6\x9c\x8810\xe6\x97\xa5'.decode('utf-8')

但这是否有效取决于控制台编码是否支持日文字符。例如,如果控制台的编码是“iso拉丁语-1”,则它将不起作用…
我建议你读:http://www.joelonsoftware.com/articles/Unicode.html

07-28 02:26