我正在使用此OCR的编译后的.NET版本,可以在@http://www.pixel-technology.com/freeware/tessnet2/中找到
我可以使用它,但是这样做的目的是翻译车牌,可惜引擎确实不能准确翻译一些字母,例如,这是我扫描以确定字符问题的图像
结果:
12345B7B9U
ABCDEFGHIJKLMNUPIJRSTUVHXYZ
因此,以下字符被错误地翻译:
1,O,Q,W
这似乎还不错,但是在我的车牌上,结果并不是很好:
= H4 ODM
= LDH IFW
假测试
= NR4 y2k
如您所知,我已经尝试了降噪,增加对比度并删除不是绝对黑的像素,但没有真正的改进。
显然,您可以“学习”引擎的新字体,但是我想我需要重新编译.NET的库,而且看来这是在我没有的Linux操作系统上执行的。
http://www.scribd.com/doc/16747664/Tesseract-Trainingfor-Khmer-LanguageFor-Posting
因此,我为下一步尝试着迷,我编写了一个快速控制台应用程序,纯粹是出于测试目的,如果有人想尝试的话。如果有人有任何想法/图形处理/图书馆思想,我将不胜感激。
最佳答案
我最近通过Tessnet2使用了Tesseract(如果没有记错的话,Tessnet2是RémyThomas制造的Tesseract 2.0的VS2008 C++包装器)。让我用我对该工具的一点知识来帮助您:
vs2008
子文件夹中的VS2008解决方案。该解决方案由VS2008 C++项目组成,因此要在C#中获得结果,您必须将.NET P/Invoke与该项目构建的tessDll
一起使用。同样,如果您需要这样做,我会提供一些您可能感兴趣的代码示例,但是您可能希望继续使用C++并做自己的新WinForm项目,例如! 希望对您有所帮助,请随时给我您的意见和疑问!
关于c# - Tesseract OCR库-学习字体,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/4908919/