用tesseract识别名片,无任何训练
数字,字母识别的准确率比较高,没有错误,规范的汉字识别的还可以,比如名片背面,正面的就错误比较多了;
没有任何训练,识别的还算可以了;我们主要要的电话和QQ
712 wget https://github.com/tesseract-ocr/tessdata/blob/master/chi_sim.traineddata
713 ls -lth
714 rm chi_sim.traineddata #下载太慢了,还是用浏览器下载快,然后上传过去
715 rz -e
716 ls
717 tesseract test.jpg result -l chi_sim
718 cp chi_sim.traineddata /usr/local/share/tessdata/
719 sudo cp chi_sim.traineddata /usr/local/share/tessdata/
720 tesseract test.jpg result -l chi_sim