假设我有以下两个变量:

bob1 = u'bob\xf0\xa4\xad\xa2'

bob2 = 'bob\xf0\xa4\xad\xa2'


如何获取bob1的值作为bob2的值?也就是说,如何展开unicode格式,但保留十六进制的值?

如果我这样做:

bob1.encode('utf8')
'bob\xc3\xb0\xc2\xa4\xc2\xad\xc2\xa2'


那是不对的...

救命!

最佳答案

U + 0000和U + 00FF之间的代码点以ISO 8859-1或Latin 1编码映射到相同的字节值。

>>> u'bob\xf0\xa4\xad\xa2'.encode('latin-1')
'bob\xf0\xa4\xad\xa2'

关于python - Python撤消Unicode,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/4271670/

10-08 20:33