Tegaki是一款开源的手写输入法,可以运行在Windows、Mac OS X和UNIX/Linux上。可以参见其项目主页http://tegaki.org/。本文主要介绍如何在Ubuntu 11.04(Linux发行版之一)中安装。
本文是本人实践安装Tegaki的产物,可能并不适用于读者,但我希望本文能为读者提供参考。本文提供的知识不一定正确。
有个知识要先讲。UNIX/Linux上的手写输入法一般由3个组件组成,一是界面GUI,二是引擎(Engine),三是模式文件(Model)。模式文件是中文日文韩文等某种语言里每个字的信息。识别一个字的过程是,GUI接收笔画输入,把笔画输入传给引擎处理,引擎在模式文件里找到匹配的字。一个模式文件可能只能被一种特定的引擎处理。于是,一款手写输入法所能识别的字符集不受限制:只要你有(可以被该输入法支持的引擎处理的)中文的模式文件,就能手写识别中文;有藏文的模式文件,就能手写识别藏文。所以,要令手写输入法能工作,要下载GUI、引擎和中文模式文件(对咱们中国人来说)。
回来了,现在讲Tegaki。它支持两种引擎,zinnia和wagomu。所以在其主页,你选某一种引擎下载即可,但请记住你的选择。(如下图)
还有,在Ubuntu系统中,输入法框架是ibus,所以不要安装scim-tegaki。除最后一项(tegaki-tools)外,其余没提到的的项目都下载下来。
zinnia and zinnia-python把你带到zinnia的主页,你要下载Zinnia和Zinnia Recognition models——Zinnia-Tomoe。在http://sourceforge.net/projects/zinnia/files/,下载zinnia和zinnia-tomoe的最新版本;而不要下载zinnia-win32,这是给windows用的。
tegaki-python、tegaki-pygtk、tegaki-recognize、ibus-tegaki、tegaki-train都比较好装。重点是要看各目录下面的README文件!然后装引擎。
安装zinnia引擎
如果选zinnia引擎,就参照http://zinnia.sourceforge.net/的说明:
但我在安装tomoe时遇到了
/usr/local/bin/zinnia_convert: error whileloading shared libraries: libzinnia.so.0: cannot open shared objectfile: No such file or directory
make: *** [handwriting-ja.model] 错误 127
遂没有成功。
安装wagomu引擎
如果选wagomu引擎,解压以后读README文件,到里面说先compile(编译)再install(安装),就照它说的做。
- 在编译时,可能提示找不到tegakiwagomu.py,你可以把wagomu.py重命名为tegakiwagomu.py。
- 可能提示unable to execute swig: No such file or directory,你要sudo apt-get install swig。
- 可能提示wagomu_wrap.cpp:149:20: fatal error: Python.h: 没有那个文件或目录,你要sudoapt-get install libglib2.0-devpython-dev。——这个解决方案实际上是用来解决两个错误的,但我忘了另一个错误是什么。
安装模式文件
因为我装zinnia失败了,wagomu装上了,所以我下载http://tegaki.org/上对应于wagomu引擎的model。
Engine | Name | Comment |
zinnia | Japanese (all) | |
zinnia | Japanese (all, light) | Smaller and faster but less accurate |
zinnia | Japanese (kyoiku kanji) | Primary school level kanji only |
zinnia | Japanese (joyo kanji) | Commonly used kanji only |
zinnia | Simplified Chinese | |
zinnia | Simplified Chinese (light) | Smaller and faster but less accurate |
zinnia | Traditional Chinese | |
zinnia | Traditional Chinese (light) | Smaller and faster but less accurate |
wagomu | Japanese (all) | |
wagomu | Japanese (kyoiku kanji) | Primary school level kanji only |
wagomu | Japanese (joyo kanji) | Commonly used kanji only |
wagomu | Simplified Chinese |
安装模式文件也要看README!
之后,重启计算机,在屏幕顶上靠右约1/4处有个键盘图标,点击它。得到如下图界面后点击选择输入法,其他|tegaki。(下图的输入法列表里已经有了“其他-tegaki”是因为我事先已经添加过了。)
测试了一下,wagomu识别率不高,没有早先微软拼音的那个好用。我下载了tegaki-train,在终端里输入tegaki-train,打开图形界面,(远程用ssh或telnet打开要失败的),企图训练一下wagomu——完善模式文件。可见http://tegaki.org/userdoc/4.2节。
tegaki-train打开后,要新建或打开一个字符集文件,字符集文件包含好多字符,这些字符显示在左边的框里。每个字都要定义一组模式,一个模式就是该字的所有笔画的位置。一个字的模式越多,识别到该字的几率越高。另外,你可以字是“牛”,但模式里输入“逼”;于是你手写“逼”,软件会认为这是“牛”。
但是tegaki-train很不完善!左边添加一个汉字——它说要输入Unicode,那好——,我输入0x597E,它显示出这是“奾”;我输入0x597D,它就没反应(但没有失去响应)。也罢,我就补充一下“奾”的模式吧,可是工具条上的“+”按钮点了没反应。不知道是我人品差还是不会用。。。
爱让一切都对了