我有一些Python代码正在接收带有错误unicode的字符串。当我尝试忽略不良字符时,Python仍然感到窒息(2.6.1版)。复制方法如下:
s = 'ad\xc2-ven\xc2-ture'
s.encode('utf8', 'ignore')
它抛出
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc2 in position 2: ordinal not in range(128)
我究竟做错了什么?
最佳答案
将字符串转换为unicode实例是Python 2.x中的str.decode()
:
>>> s.decode("ascii", "ignore")
u'ad-ven-ture'