阅读目录
在Unicode中,如果两个字形共享相同的词源(etymology),但外观和Unicode字符编码稍有不同,则两个字形互为Z变体(通常拼写为zVariants)。例如,Unicode字符U+8AAA 說 和U+8AAC 説 互为Z变体。Z变体的概念只适用于“CJKV 文字” (中文,日语,韩语和越南语),中日韩越统一表意文字的副标题。
1. Z轴上的区别
CJK 的 unicode 编码的分配通过三个"轴"来组织。X轴表示语义上的差异;例如,拉丁大写字母A(U + 0041A)和希腊字母α的大写字母(U + 0391A)在Unicode中由两个不同的编码表示,称为“X变体”(尽管这个术语并不常见)。Y轴表示外观上的显著差异,语义上差异不大;例如,繁体字“猫”(u+8c93 貓)和简体字(u+732b 猫 )互为Y变体。
Z轴表示较小的印刷差异。 例如,中文字符(U+838A 莊)和(U+8358荘)是Z变体, (U+8AAA 說) 和 (U+8AAC 説) 也同样是Z变体。 Unicode.org 的术语表中,将“Z-变体”定义为“两个具有相同语义和统一形状的CJK统一表意文字”,或者是在CJKV统一表意文字中。
可以这样讲,如果CJK统一表意文字是完美“统一”的,Z变体也不会出现。它的出现是为了帮助文本在Unicode和其他CJK编码——比如Big5和CCCII——之间"往返"。例如,字符 “莊” 的CCCII编码为 21552D,同时其Z变体 “荘” 则有CCCII编码 2D552D。这两个变体分别被赋予了不同的Unicode码,因此可以无损的将文本在CCCII编码和Unicode码之间转换。
2. 问题
关于"Z变体"确切的定义, 还存在一些疑惑。例如,在2002年的一项 Internet草案 (RFC 3743)中, (U+4E0D 不) 和 (U+F967 不) 被定义为“字形变体(font variants)”,而普通话中的 (U+5154 兔) 和日语中的(U+514E 兎) ——语义都是“兔子”——则都被Unicode联盟的统汉字数据库认为是Z变体。