本文介绍了有没有办法加速使用tesseract OCR引擎提取,而tiff文件有600-700页?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧! 问题描述 在处理tiff文件期间,我们监控文件大约需要40到50分钟,这些文件有来自Tesseract OCR引擎且带有特定选项的600-700页。 我们监控到处理大文件的时间太长了。 我们有办法加快这个过程吗? 以下命令使用: - tesseract.exeSource_Tiff_FileDestination_Filehocr 解决方案 1)联系图书馆作者进行性能调整。 2)在更快的硬件上运行。 我快速浏览了Tesseract搜索结果,它出现了OCR引擎支持AMD GPU。 因此理论上可以加快处理速度; a)投资更高规格GPU 配上; b)性能更高的CPU。 做一些研究,问一些问题开发人员。 During processing of tiff files, which are having 600 - 700 pages from Tesseract OCR engine with hocr option, we monitored that files are taking around 40 - 50 minutes.We monitored that it is so much time for processing large files.Do we have any way to speed up the process?Following command is using: -tesseract.exe "Source_Tiff_File" "Destination_File" hocr 解决方案 1) Contact the library authors for performance tweaks.2) Run on faster hardware.I had a quick look at Tesseract search results and it appears that the OCR engine supports AMD GPUs.Therefore in theory it may be possible to speed up processing by;a) investing in a higher specification GPUcoupled with;b) higher performance CPU.Do some research, ask some questions of the developers. 这篇关于有没有办法加速使用tesseract OCR引擎提取,而tiff文件有600-700页?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!
10-16 10:25