我正在尝试开发一种能读取草书笔迹的算法(确切地说是医生的笔迹)。我不需要匹配每个字母,只需匹配可识别的字母(我正在使用字典方法)。

现在,我在BufferedImage类中具有二值化图像。接下来,我需要隔离每个字符。

您能提供一个伪代码告诉我如何实现这一目标吗?我想尽量减少使用其他库。我想通过学习如何实现每个过程来做到这一点。有什么提示吗?

最佳答案

您将需要了解诸如Image Moments之类的东西,即使它们已经旋转或缩放,也可以用来比较图像

您将需要大量的数学知识来了解如何做到这一点,您可以先阅读http://www.ias.ac.in/sadhana/Pdf2007Oct/521,它是关于如何实现特定字符(Kannada)的OCR的,相同的通用原则也应适用于您的内容。正在尝试做

除非您愿意为此花费数月(或数年),否则我建议您使用已经可用的东西,例如ocropusjavaocr

10-06 13:45
查看更多