嗨,我想生成tesseract OCR训练数据文件(tessdata)。我正在使用jTessBoxEditor工具(在Mac OS上)实现此功能,但我不知道如何使用此工具。此外,我还在ios应用程序中使用了tessdata文件。
我也在寻找这个,我和你分享链接
http://vietocr.sourceforge.net/training.html
http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3
但我没有运气:(。因此,请共享由训练文件(teasdata文件)的陡峭实现提供详细/陡峭的链接。
最佳答案
这是tess文件的下载
http://code.google.com/p/tesseract-ocr/downloads/detail?name=tesseract-ocr-setup-3.02.02.exe&can=2&q=
我与您在同一页面上,以使其正常工作。这是tut im正在使用。
http://www.resolveradiologic.com/blog/2013/01/15/training-tesseract/
我了解到,您需要在同一文件夹中包含一个.tif文件和一个.box文件,以加载这些盒子。
例如
testdata.tif
testdata.box
anotherExample.eng.tif
anotherExmaple.eng.box
如果您不知道如何下载和安装tesseract文件后不知道如何轻松创建盒子文件。
->打开命令提示符并CD到您的tesseract文件,该文件通常位于programfiles / Tesseract-ocr文件夹中
->运行框创建者tesseract C:\ tif文件的位置\ thetiffile.tif C:\ tif文件的位置\ thetiffile.tif
batch.nochop makebox
那应该吐出您需要的盒子文件。
我正在经历和发现。我会及时通知你的。如果您还有其他问题,请告诉我,也许我可以帮助您。
关于ios - 使用jTessBoxEdit培训Tesseract OCR,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/20879146/