我提议将我的windows-1252xhtml网页转换为UTF-8。
我的代码中有以下字符实体:
'-撇号,
►-右指针,
◄-左指针。
如果我使用编辑器更改字符集并将页面保存为UTF-8:
撇号仍然作为一个字符实体存在;
指针被转换为代码中的符号(可能是因为UTF-8不支持实体?).
问题:
如果我正确理解UTF-8,则不需要使用实体,可以直接在代码中键入字符。在哪种情况下,我可以用键入的撇号替换#39
编辑器将指针符号直接放进我的代码中是正确的吗?这些符号在现代浏览器上是否会可靠地显示出来,看起来没问题?如果我使用UTF-8,我可能无论如何都无法还原到实体?
谢谢。

最佳答案

实体有三个目的:编码无法在使用的字符编码中编码的字符(与UTF-8不相关)、编码不方便在给定键盘上键入的字符以及编码非法的非转义字符。
►应该始终生成►无论编码是什么。如果没有,那是别的地方的虫子。
在UTF-8中直接在源中是可以的。你既可以这样做,也可以实体化,这没什么区别。
“在大多数情况下都是好的,但在某些情况下不是。允许以下两种情况:

<span title="Jon's example">This is Jon's example</span>

但必须编码在:
<span title='Jon&#x27;s example'>This is Jon's example</span>

因为否则它将被视为结束属性值的。

07-28 02:59
查看更多