我在python从.txt文件中读取字符串时遇到问题
文件包含以下数据:\ xce \ x97
以ascii编码(类似于python字符串的“ \ xce \ x97”)
我想将其转换为UTF-8编码
file.open("file.txt", "r")
a = file.read() #a = "\\xce\\x97"
file.close()
该字符串的正确值是:“Η”(其希腊字母,大写字母“η”)
我可以使用
>>>a = b'\xce\x97'
>>>print(a.decode("utf-8"))
>>>Η
我该如何使用变量a?
最佳答案
对于解码问题:
a = "\\xce\\x97"
print(a.encode().decode('unicode-escape').encode("latin-1").decode('utf-8'))
'Η'