我已经用tesseract成功创建了一个盒子文件
现在运行unicharset_extractor之后
让它创建如下所示的unicharset文件:

...
n 3 NULL -1
s 3 NULL 23
t 3 NULL 43
...


我继续执行此命令

mftraining -U unicharset -O testlang.unicharset testlang.tr


只是得到下一个错误

Reading testlang.tr ...
testlang has no defined properties.

Error: Illegal short name for a feature!

最佳答案

我从未使用过Tesseract,但似乎错误数据库中有一个未解决的问题,看起来很像您的问题:http://code.google.com/p/tesseract-ocr/issues/detail?id=385

似乎与某些功能未正确支持的科学表示法有关。

在问题页面上,用户提出了解决方案,而另一个人提出了补丁。您可以尝试应用补丁以查看是否有帮助。

10-07 19:47
查看更多