嗨,我从via图书馆收到短信,当我打印收到的短信时,我看到一些非英语字符是“\u00e7”,而它必须是“ç”我想我需要对文本进行编码和重新解码,但我对python很陌生,如果它是正确的方法,我就不会这样做你能给我指点迷津吗?

最佳答案

使用unicode_escape encoding解码字符串:

>>> s = r'\u00e7'
>>> print s
\u00e7
>>> print s.decode('unicode-escape')
ç
>>>

如果sys.stdout.encodingascii,则打印将提升UnicodeEncodeError;在这种情况下,请显式编码:
>>> print s.decode('unicode-escape').encode('utf-8')
ç

07-27 13:31