我在文件命令行函数中有一些行为。似乎它将空字节分类为数据文件,尽管据我所知,我可以在网上找到的空字节是UTF-8的一部分。下面是我的问题的一个例子。
printf "Hello\00, World!" > test.txtfile test.txtOutput: test.txt: data
为什么这不是UTF-8?

最佳答案

它被归类为通用数据是因为0字节,这在正常的人类可读文本中是不存在的。如果你把它去掉,因为它只有可打印的ASCII字符,它会被归类为,而不是UTF-8。

关于linux - File(1)将空字节分类为数据文件,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/52402658/

10-10 10:02