我是计算机视觉的初学者,但是我知道如何在opencv上使用某些功能。我正在尝试使用Opencv进行文档识别,希望获得帮助以找到相应的步骤。

我想使用opencv示例find_obj.cpp,但是文档(例如护照)具有一些变量,名称,生日,图片。因此,我需要帮助来定义它的步骤,以及在可能的情况下如何在这些步骤上使用功能。

我并不是在问完整的代码,但是如果有人有任何示例链接,或者您只可以键入演练,那将有很大的帮助。

最佳答案

这里涉及两个非常不同的步骤。一种是检测您的物体,另一种是对其进行分析。

对于对象检测,您只是试图确定对象是否在框架中以及大约位于什么位置。 OpenCv功能框架对此非常有用。有关一些教程和全面的示例代码,请参见OpenCv features2d教程,尤其是feature matching tutorial

为了进行分析,您需要深入研究光学字符识别(OCR)。 OpenCv不包括OCR库,但我建议您查看tesseract-ocr,它是一个很棒的OCR库。如果您的文档具有固定的结构化(文本字段一致的布局),则只需tesseract-ocr。要进行更高级的分析,请查看ocropus,它使用tesseract-ocr但添加了布局分析。

关于image-processing - 如何将Opencv用于OCR的文档识别?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/7542194/

10-12 21:09