最近使用 Tess4j 做一些 OCR图片文字识别的代码。

然后想当然的将这个 ITesseract ocr_robot = new Tesseract(); 作为了工具类做成了成员变量。

当多线程调用 doOCR 的时候就会报 Invalid memory access 的错。

然后从网上查了好几个都说是 setDatapath 的设置问题。

最后发现其实是 doOCR 源码里面有个init方法。

Tess4j/Tess4j 多线程调用 过程中报错问题记录 Invalid memory access-LMLPHP

然后,init 会重新初始化一些参数。 所以 不能用多线程调用同一个Tesseract 对象的doOCR方法。

Tess4j/Tess4j 多线程调用 过程中报错问题记录 Invalid memory access-LMLPHP

这样会导致内存混乱吧。需要把Tesseract代码改成多实例。或者使用对象池。

05-11 20:26