无忧启动论坛

标题: 请教坛友们一个关于OCR识别的问题 [打印本页]

作者: N140JCE-EL1    时间: 2023-6-4 15:44
标题: 请教坛友们一个关于OCR识别的问题
本帖最后由 N140JCE-EL1 于 2023-6-4 16:00 编辑

请教坛友们一个关于OCR识别的问题:

因最近有在做一个OCR自动化识别仪器上的数字的脚本,发现问题:


a.思路一:目前调用Umi-OCR引擎(识别准确率很高),但是OCR识别过程中需要点击打开文件,输入识别的OCR图片的路径,点击确定,再点击开始任务,过一会会得到OCR的输出结果【TXT文本格式】,接着要进行正则匹配匹配要的数字结果。这种方法执行率有点低,而且此软件好像没有命令行模式。目前有没有类似的可以命令行调用的OCR软件?




b.思路二:使用谷歌开源的Tesseract OCR脚本,调用Python脚本辅助进行OCR识别,但是这个识别效果不理想,有时识别不出来数字,而且有考虑去对Tesseract进行样本训练,但是数字组合比较多,这个训练起来是一个庞大的工作量。
所以想请教下万能的网友,是否有其他OCR引擎或者更好的方法?

2023-06-04_15-25-58.png (32.82 KB, 下载次数: 50)

2023-06-04_15-25-58.png

作者: cdl_1    时间: 2023-6-4 17:27
a加入更多的训练模型;b尽可能的规范化作业者的书写规范
作者: ddsdeng    时间: 2023-6-4 17:41
很好,十分感谢!
作者: 邪恶海盗    时间: 2023-6-4 18:09
这种不是用专用解决方案么,比如停车场的车牌识别系统,纯软件地话效率肯定低
作者: 翅膀    时间: 2023-6-4 18:40
提示: 作者被禁止或删除 内容自动屏蔽
作者: snow99    时间: 2023-6-4 19:28
Umi-OCR 文字识别工具 是开源的,自己改吧
https://github.com/hiroi-sora/Umi-OCR
免费:本项目所有代码开源,完全免费。
方便:解压即用,离线运行,无需网络。
批量:可批量导入处理图片,结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。
高效:采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线OCR服务更快。


作者: ezozo    时间: 2023-6-4 20:43
免费的吗

作者: 2011阿星    时间: 2023-6-4 22:49
还用想嘛肯定paddlepaddle,市面大部分OCR都是基于此项目的,你的Umi-OCR也是基于此封装的
https://github.com/PaddlePaddle/PaddleOCR

作者: lal    时间: 2023-11-9 17:07
十分感谢分享
作者: megatron    时间: 2024-1-26 07:51
大佬,转了一圈,还是你的ltsb最好用,特此感谢
作者: tanchenglong    时间: 2024-1-26 08:15
我只是来打酱油的,Mark一下!
作者: likeyouli    时间: 昨天 14:20
搜到您这个问题,遇到同样的情况,请问楼主解决没有? 可否大概说说解决方法 ?




欢迎光临 无忧启动论坛 (http://wuyou.net/) Powered by Discuz! X3.3