无忧启动论坛

标题: 请教坛友们一个关于OCR识别的问题 [打印本页]

作者: N140JCE-EL1 时间: 2023-6-4 15:44
标题: 请教坛友们一个关于OCR识别的问题
本帖最后由 N140JCE-EL1 于 2023-6-4 16:00 编辑

请教坛友们一个关于OCR识别的问题：

因最近有在做一个OCR自动化识别仪器上的数字的脚本，发现问题：

a.思路一：目前调用Umi-OCR引擎（识别准确率很高），但是OCR识别过程中需要点击打开文件，输入识别的OCR图片的路径，点击确定，再点击开始任务，过一会会得到OCR的输出结果【TXT文本格式】，接着要进行正则匹配匹配要的数字结果。这种方法执行率有点低，而且此软件好像没有命令行模式。目前有没有类似的可以命令行调用的OCR软件？

b.思路二：使用谷歌开源的Tesseract OCR脚本，调用Python脚本辅助进行OCR识别，但是这个识别效果不理想，有时识别不出来数字，而且有考虑去对Tesseract进行样本训练，但是数字组合比较多，这个训练起来是一个庞大的工作量。
所以想请教下万能的网友，是否有其他OCR引擎或者更好的方法？

2023-06-04_15-25-58.png (32.82 KB, 下载次数: 205)

作者: cdl_1 时间: 2023-6-4 17:27
a加入更多的训练模型；b尽可能的规范化作业者的书写规范

作者: ddsdeng 时间: 2023-6-4 17:41
很好，十分感谢！

作者: 邪恶海盗 时间: 2023-6-4 18:09
这种不是用专用解决方案么,比如停车场的车牌识别系统,纯软件地话效率肯定低

作者: 翅膀 时间: 2023-6-4 18:40
提示: 作者被禁止或删除内容自动屏蔽

作者: snow99 时间: 2023-6-4 19:28
Umi-OCR 文字识别工具是开源的，自己改吧
https://github.com/hiroi-sora/Umi-OCR
免费：本项目所有代码开源，完全免费。
方便：解压即用，离线运行，无需网络。
批量：可批量导入处理图片，结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。
高效：采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够，通常比在线OCR服务更快。

作者: ezozo 时间: 2023-6-4 20:43
免费的吗

作者: 2011阿星 时间: 2023-6-4 22:49
还用想嘛肯定paddlepaddle，市面大部分OCR都是基于此项目的，你的Umi-OCR也是基于此封装的
https://github.com/PaddlePaddle/PaddleOCR

作者: lal 时间: 2023-11-9 17:07
十分感谢分享

作者: megatron 时间: 2024-1-26 07:51
大佬，转了一圈，还是你的ltsb最好用，特此感谢

作者: tanchenglong 时间: 2024-1-26 08:15
我只是来打酱油的，Mark一下！

作者: likeyouli 时间: 2024-11-21 14:20
搜到您这个问题，遇到同样的情况，请问楼主解决没有？可否大概说说解决方法？

欢迎光临无忧启动论坛 (http://wuyou.net/)