我已经用tesseract成功创建了一个盒子文件
现在运行unicharset_extractor之后
让它创建如下所示的unicharset文件:
...
n 3 NULL -1
s 3 NULL 23
t 3 NULL 43
...
我继续执行此命令
mftraining -U unicharset -O testlang.unicharset testlang.tr
只是得到下一个错误
Reading testlang.tr ...
testlang has no defined properties.
Error: Illegal short name for a feature!
最佳答案
我从未使用过Tesseract,但似乎错误数据库中有一个未解决的问题,看起来很像您的问题:http://code.google.com/p/tesseract-ocr/issues/detail?id=385
似乎与某些功能未正确支持的科学表示法有关。
在问题页面上,用户提出了解决方案,而另一个人提出了补丁。您可以尝试应用补丁以查看是否有帮助。