用C#写了个汉字转拼音的小工具,和网上大部分工具不同,这个通过分词算法,解决了多音字的问题,并且提供声调,可开可关。
如题,用"银行 行不行 行家说了算"举例,如果转拼音却不能识别多音字,就惨了。
而这个小工具的效果如图:
实现了3种分词算法:
* 正向最大匹配
* 反向最大匹配
* 双向最大匹配
(这个双向匹配的歧义处理办法,还是本人创新。。。)
软件下载:
http://pan.baidu.com/s/1mTg3T
-----------------分割线---------------------
这里,不得不提一下分词算法这个事情。
不过都写在这就太长了,还是放到下一篇再谈。
-----------------源代码(含生成好的程序)--------------------
百度网盘:
http://pan.baidu.com/s/1ED1Ls
腾讯微云:
http://url.cn/PnnMOU
使用注意:
* bin/release目录下,已经包含了生成的软件。
* 显示拼音时,因为词库的中文单字非常不全,我引用了微软的ChnCharInfo.dll,来获得一些单字拼音。这个库是要下载Visual Studio International Pack安装到系统才会有的。
不过你可以直接从bin/release里面找到,自己重新引用一下就行了。只需要引用: ChnCharInfo.dll,但下面2个文件也不能删掉ChnCharInfo.xml和zh-CN目录下的 ChnCharInfo.resources.dll