从txt文件读取-有一个字节导致我编码问题:
with open(input_filename_and_director, 'rb') as f:
r = unicodecsv.reader(f, delimiter="|")
导致错误消息:
UnicodeDecodeError: 'utf8' codec can't decode byte 0xc3 in position 26: invalid continuation byte
无论如何,有没有指定我要如何处理这些字节(即以另一个字符的形式读取此字节)?
最佳答案
根据您的需要,尝试使用unicodecsv.reader(f, delimiter="|", errors='replace')
或unicodecsv.reader(f, delimiter="|", errors='ignore')
。 unicodecsv通过errors
参数传递给unicode编码。有关更多信息,请参见unicode
或here的帮助。