我有一些Python代码正在接收带有错误unicode的字符串。当我尝试忽略不良字符时,Python仍然感到窒息(2.6.1版)。复制方法如下:

s = 'ad\xc2-ven\xc2-ture'
s.encode('utf8', 'ignore')

它抛出
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc2 in position 2: ordinal not in range(128)

我究竟做错了什么?

最佳答案

将字符串转换为unicode实例是Python 2.x中的str.decode():

 >>> s.decode("ascii", "ignore")
 u'ad-ven-ture'

09-25 17:26
查看更多