有人知道中文拼音是否支持吗?我得到的结果here具有正确的汉语拼音(请参阅“显示罗马化”链接)。
谢谢。
最佳答案
我不知道Google AJAX语言API是否支持转换为拼音,但是如果不支持,那么在您的应用上进行可传递的转换实际上并不难。 (从拼音到汉字(字符)的反向转换要复杂得多,因为拼音非常有损。)
要自己进行转换,请获取Unihan.zip的可向下移动版本Unihan database。您实际上关心的文件是Unihan_Readings.txt。它还包含了许多您不需要关心的东西,并且以非常低效的方式存储,因此不必太担心大文件的大小。您应该提取您关心的内容并以更有效的方式进行存储。
在其中,您会发现以下制表符分隔的行:
U+597D kCantonese hou2 hou3
U+597D kDefinition good, excellent, fine; well
U+597D kHangul 호
U+597D kHanyuPinlu hao3(6060) hao1(142) hao4(115)
U+597D kHanyuPinyin 21028.010:hǎo,hào
U+597D kJapaneseKun KONOMU SUKU YOI
U+597D kJapaneseOn KOU
U+597D kKorean HO
U+597D kMandarin HAO3 HAO4
U+597D kTang *xɑ̀u *xɑ̌u
U+597D kVietnamese háo
U+597D kXHC1983 0445.030:hǎo 0448.030:hào
左列(“ U + 597D”)是Unicode代码点,中间列是属性名称,而右列是属性值。您可以提取kHanyuPinyin属性或kMandarin属性。它们对基本相同的信息进行编码-随便使用哪种格式都更容易处理。 (hǎo== HAO3,hào== HAO4,如果不太明显的话)
您会注意到,对于某些字符(例如我在此处选择的示例),有多种发音。这是一个棘手的问题。根据所需的精度,您可能可以只使用列出的第一个罗马化,因为它们按频率递减的顺序排列。 (实际上,这是kHanyuPinyin与kMandarin有点不同的地方之一-实际上,它具有多个发音列表,每个列表按频率排序。)