我得到了用廉价相机拍摄的灰度图像,我需要制作一个程序ocr。
主要问题是噪声或对象不是文本,但它们存在于二值图像中。
现在我想到了从图像中提取文本。
我需要一些好的算法。
你能推荐一个真正好的吗?
例如,如果图像包含黑色文本和类似黑色线条的内容
然后该算法将只选择没有行的文本。
最佳答案
您描述了两种要移除的噪波。(顺便说一下wikipedia page的降噪效果还不错,请看“in images”部分)。
一种是奇点噪声。这通常被称为“斑点”或“盐和胡椒”噪声,通常通过某种平均滤波器来消除。在mathworks有一个很好的页面描述了一些算法。
第二种是线条。这比较困难,我不会真的把它描述成噪音,这取决于你输入的图像类型。This paper似乎是合适的,但它不能在网上免费提供,因此您可能需要购买它或去当地的大学图书馆。
您可能还想看看this,它可以从许多地方下载,但实际上是用于电影(视频),所以可能不是您想要的。