我有一个项目需要使用OCR扫描某些图像。
我知道该软件abbyy finereader的性能很好(还尝试了一个对我来说几乎完美的试用版),现在我想知道如何将此软件嵌入python或其他简化语言中,以便以后可以简单地运行命令行脚本,例如python the_script.py image.jpg
将图像作为参数,使用它执行abbyy finereader并返回识别的文本...
我在Google上找不到方法,没有!!我只发现了这样的东西:
https://github.com/mikesname/python-ocrlab/blob/master/ocrsite/ocrlab/nodes/abbyy.py
但无法弄清楚它的真正作用...
还是我需要哪一款Abbyy软件!识别服务器或OCR引擎还是其他?
在此先多谢
最佳答案
我从事ABBYY技术已经超过15年了。我曾经为ABBYY工作,现在我为WiseTREND工作-ojit_a是美国主要的ABBYY技术VAR和集成商之一。
FineReader,即零售盒装产品,旨在供运算符(operator)独立交互使用。该软件包中不提供命令行和API自动化功能。如果使用量很少,则可以将FineReader Corporate Edition用作简单的黑匣子,将其设置为Hot Folder,然后让脚本将图像拖放到该Input文件夹中,等待处理,然后从Output文件夹中取出。
为了更好的自动化和集成,需要使用不同于FineReader的产品。
首先,确定您是否想要本地软件或基于云的OCR。
云-ABBYY,OCR-IT和其他一些提供商通过Web请求提供OCR。通常按页面付费,无需购买软件。
本地-一些软件将在您的服务器上运行,并通过黑盒或通过直接API为您提供OCR功能的脚本。 Recognition Server是为此考虑的下一个产品。最后,如果您正在开发一个大型应用程序,需要将其分发给众多用户,或者需要深入的OCR控制,则可以考虑使用Engine SDK。
如果您想分享更多您希望如何集成OCR以及需要实现什么数量和功能的信息,我们可以尝试缩小范围。
关于image - Abbyy Finereader命令行用法/python用法?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/21885050/