1 编码与解码
s.encode("utf-8") 编码以utf-8 编码成2进制
s.decode("utf-8) 以2进制解码成unicode
>>> s_utf8 = s.encode("utf-8") >>> s_utf8 b'\xe4\xbd\xa0\xe5\xa5\xbd\xe6\x9c\xaa\xe6\x9d\xa5' >>> s_utf8.decode("utf-8") '你好未来'
2 编码的转换
把文字从一种编码转换成另外一种, 从gbk 转成utf-8
为什么要进行编码的转换
windows gbk
文件: gbk 文件
linux/mac utf-8
文件: utf-8
gbk ---> unicode-----> utf-8
unicode : 万国码
跟所有的编码之间, 有映射关系
f = open("byte.txt", "rb") s = f.read() f.close() s_unicode = s.decode("gbk") # 转成 unicode s_utf8 = s_unicode.encode("utf-8") f = open("byte.txt",'wb') f.write(s_utf8) f.close()