怎么把汉字转换成汉字拼音?

例如。

你->Nǐ

马->Mǎ

更多信息:

汉字拼音的重音符号或数字形式都是可以接受的,数字形式是我的首选。

首选Java库,但是也可以使用包装在包装器中的其他语言的库。

我希望有人亲自使用这样的库,然后就其质量/可靠性建议或评论它。

最佳答案

将汉字转换为拼音的问题是一个相当困难的问题。根据上下文,有许多汉字字符具有多个拼音表示形式。比较长大(拼音:zhang da)和长城(拼音:chang cheng)。因此,单字符转换通常实际上是无用的,除非您的系统输出多种可能性。还有分词的问题,它也会影响拼音的表示形式。尽管也许您已经知道这一点,但我认为说这一点很重要。

就是说,Adso Package基于出色的Adso库,既包含分段器又包含概率性的拼音注释器。虽然要花一些时间才能习惯,但可能会比您要查找的要大得多(我过去发现它太笨拙了,无法满足我的需求)。此外,似乎在任何地方都没有公共(public)API,并且它的C++ ...

对于一个最近的项目,因为我使用的是地名,所以我只使用了Google Translate API(特别是非官方的Java端口,该端口至少对于普通名词来说,通常可以很好地转换为拼音。问题通常是的替代音译系统,例如“HongKong”(应称为“XiangGang”)。鉴于所有这些,Google Translate的功能非常有限,但它提供了一个起点。我之前没有听说过pinyin4j,但在使用它之后刚才,我发现它不是最佳方法-虽然它会输出潜在的候选拼音罗马化列表,但并未尝试统计确定它们的可能性,虽然有一种方法可以返回单个表示形式,但是很快就会分阶段进行出来,因为它目前仅返回第一个罗马化,而不是最有可能的。程序似乎做得很好的地方是在罗马化和常规可配置性之间进行转换。

简而言之,答案可能是上述任何一种,具体取决于您的需求。异质专有名词?谷歌翻译。需要统计吗?阿佐愿意接受没有上下文信息的候选人名单吗?拼音4j。

关于language-agnostic - 转换汉字为汉语拼音,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/4361971/

10-12 02:00