我想知道Windows如何解释字符,例如:

我用一个Hexeditor用3个字节的E3 81 81制作了一个文件。
这些字节是被编码为UTF-8的"ぁ"字符。

我打开记事本,它显示"ぁ"
我没有指定文件的编码,我只是创建了字节。
和记事本正确地解释它。

记事本在猜测可能是什么编码吗?
还是十六进制编辑器使用特定的编码保存这些字节。

最佳答案

如果文件仅包含这三个字节,则根本没有有关使用哪种编码的信息。

一个字节只是一个字节,无法在其中包含任何编码信息。此外,十六进制编辑器甚至不知道您打算将数据解码为文本。

记事本通常使用ANSI编码,因此,如果它以UTF-8格式读取文件,则必须根据文件中的数据猜测编码。

如果将文件另存为UTF-8,则记事本会将BOM(字节顺序标记)EF BB BF放在文件的开头。

关于windows - Windows记事本如何解释字符,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/6769311/

10-10 10:34