我整理了一个快速的WinForm/嵌入式IE浏览器控件,该控件每天早上登录到我们公司的银行网站,然后抓取/导出所需的存款信息(该银行是一家规模较小的区域性银行)。由于我们从同一个主帐户中提取了几十个“伪帐户”,因此检索实际上需要10-15分钟。

无论如何,唯一的问题是我们的商业银行帐户需要RSA安全 token (http://www.rsa.com/node.aspx?id=1156)--if,您不熟悉,这是一个小型设备,每15(?)秒显示一个随机的6位数字,所以我必须提示输入此值在开始之前,这是基于网站基于登录的安全模型的基础,因此,即使您创建了不能执行任何操作的只读帐户,也仍然需要输入RSA编号。对于不同的 token ,我们有5个 token 公司里的人。

从我们的角度来看,这是讨厌的安全。我开玩笑说要使用网络摄像头对 key 卡上的数字进行OCR,这样他们就不必键入它了-主要是为了使抓取/导出操作可以在任何人早上到达之前完成。好吧,他们问我是否真的可以做到。

因此,现在我问您,从相机产生的JPEG图像中,您认为要可靠地OCR这些数字需要多少时间(几小时)?我已经知道我可以轻松获得JPEG。我认为您尝试3次登录,因此确实需要达到99%的准确率。我可以在下类时间进行此工作,但他们不希望我花几个小时以上的时间,因此我想尽可能多地利用现有代码。这是一个7段显示器(如闹钟),因此它并不是OCR软件包用来查看的文字。

另外-显示屏侧面有一个倒数计时器;通常,当它降至1 bar时,您要等到下一个数字出现并以5 bar重新开始(例如您手机上的信号强度)。因此,这也需要OCRd,但这不是文本。

无论如何,我在输入此内容时会考虑得越多,就越不相信自己能真正做到这一点,所以也许我应该在业余时间进行研究吗?

最佳答案

实际上,这比起初看起来要容易。基于数字始终看起来相同且始终出现在相同位置的事实,我过去曾使用过这种技术。

只需创建十个小蒙版,每个数字一个,然后准备一个脚本即可将一个jpg图像拆分为多个片段,每个数字一个。对准相机一次,然后再将其放置。现在,您有10个0-9的掩码以及设备上的实际数字。将每个 mask 中的像素值乘以每个数字,并在每种情况下选择最大值。这将告诉您每个数字最适合哪个蒙版,您可以使用它来确定数字。

免责声明:正如其他评论者所指出的那样,出于安全原因,我认为这不是一个好主意。

关于key - OCR RSA key 卡(安全 token ),我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/1983879/

10-12 22:42