我想知道Windows如何解释字符,例如:
我用一个Hexeditor用3个字节的E3 81 81
制作了一个文件。
这些字节是被编码为UTF-8的"ぁ"
字符。
我打开记事本,它显示"ぁ"
我没有指定文件的编码,我只是创建了字节。
和记事本正确地解释它。
记事本在猜测可能是什么编码吗?
还是十六进制编辑器使用特定的编码保存这些字节。
最佳答案
如果文件仅包含这三个字节,则根本没有有关使用哪种编码的信息。
一个字节只是一个字节,无法在其中包含任何编码信息。此外,十六进制编辑器甚至不知道您打算将数据解码为文本。
记事本通常使用ANSI编码,因此,如果它以UTF-8格式读取文件,则必须根据文件中的数据猜测编码。
如果将文件另存为UTF-8,则记事本会将BOM(字节顺序标记)EF BB BF
放在文件的开头。
关于windows - Windows记事本如何解释字符,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/6769311/