我可以通过命令行使用tesseract 4.0获得单词级别的置信度得分。有兴趣知道是否也有办法获得角色自信心。

对于单词级别的置信度,请使用以下命令:

tesseract [Image name] outputbase --oem 1 -l eng --psm 8 tsv

最佳答案

在配置文件中设置hocr_char_boxes to 1。或者,在命令行上,更新后的命令将是:

tesseract [Image name] outputbase --oem 1 -l eng --psm 8 -c hocr_char_boxes=1 hocr

注意hocr输出选项,并在该文件中查找... _wconf,例如
 <span class='ocrx_word' id='word_1_1' title='bbox 127 344 4618 6915; x_wconf 1'>

让我知道这是否适合您,否则我将删除答案。

资料来源:https://github.com/tesseract-ocr/tesseract/issues/1465#issuecomment-513139976

关于tesseract - 如何使用命令行在tesseract中获得角色明智的信心?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/48162645/

10-14 20:05