PaddlePaddle飞浆搭建和机器学习文字识别
文章转自:https://lingkang.top/archives/paddlepaddle-fei-jiang-da-jian-he-ji-qi-xue-xi-wen-zi-shi-bie
官网:https://www.paddlepaddle.org.cn/
飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体,是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台。
cmd执行安装飞浆
# 配置阿里云镜像
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/
python -m pip install paddlepaddle==2.3.2 -i https://pypi.tuna.tsinghua.edu.cn/simple
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hTrRjsXG-1669104078472)(/upload/2022/11/image-1669014423651.png)]
安装中
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NUwSVVd5-1669104078473)(/upload/2022/11/image-1669014438349.png)]
PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力开发者训练出更好的模型,并应用落地。
安装PaddleOCR
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/doc/doc_ch/quickstart.md
python -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
安装PaddleOCR whl,用于调用
pip install "paddleocr>=2.3.2"
等待它安装完毕
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-j0eVPNgt-1669104078474)(/upload/2022/11/image-1669014501408.png)]
图片识别
在Win+R的cmd执行,否则会找不到命令
paddleocr --image_dir ./Desktop/picture/微信图片_20220425094332.jpg --use_angle_cls true --use_gpu false
中英文检查:检测+方向分类器+识别全流程:
–use_angle_cls true设置使用方向分类器识别180度旋转文字,
–use_gpu false设置不使用GPU
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-cXQ3Tf3d-1669104078474)(/upload/2022/11/image-1669014546924.png)]
在py代码中识别
idea安装了插件,创建一个项目
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CN3NDY3V-1669104078474)(/upload/2022/11/image-1669014619606.png)]
编写识别代码
from paddleocr import PaddleOCR, draw_ocr
# Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换
# 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`
ocr = PaddleOCR(use_angle_cls=True, lang="ch") # need to run only once to download and load model into memory
img_path = './微信图片_20220425094332.jpg'
result = ocr.ocr(img_path, cls=True)
for idx in range(len(result)):
res = result[idx]
for line in res:
print(line)
# 显示结果
from PIL import Image
result = result[0]
image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='C:\\Windows\\Fonts\\simfang.ttf')
im_show = Image.fromarray(im_show)
im_show.save('result.jpg')
需要安装一些包
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TNDHOJbW-1669104078474)(/upload/2022/11/image-1669014635545.png)]
执行完毕
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ce8SLKxV-1669104078475)(/upload/2022/11/image-1669014640416.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Tpctpwm5-1669104078475)(/upload/2022/11/image-1669014651560.png)]