扫描件格式特殊,一般的 ocr api 都不能满足,需要自定义识别, 还需要批量化处理的能力, 求教怎么思路去实现?
vx: d2FuZ3NhbnhpYQ==
1
paopjian 2022-09-30 08:17:16 +08:00 via Android
扫描件格式再特殊,也能变成图片吧,难道是加密文件?
|
2
pony2335 2022-09-30 08:28:15 +08:00
感觉除了格式转换,没其他思路
|
3
jifengg 2022-09-30 08:48:33 +08:00
楼主“格式特殊”指的是文字排版特殊,以及你希望 ocr 之后能够获得指定区域的内容吧。类似身份证 ocr 。
百度云我知道有一个,可以自定义 ocr 模板的,楼主可以看看。其他云按理应该也是有的。 |
4
kujio 2022-09-30 08:59:37 +08:00
百度云不行,推荐阿里云,还有楼主是什么特殊格式,我公司之前刚做过扫描随货单自动入库的,单据都是乱七八糟格式的,现在识别率还行。
|
5
dreasky 2022-09-30 09:35:08 +08:00
百度开源 paddleOCR
|
6
joApioVVx4M4X6Rf 2022-09-30 10:00:43 +08:00
最好整个图片模板,不然不知道有多复杂
|
8
paciychen85 2022-09-30 14:58:06 +08:00
最近也有跟 OP 相似的需求,表格截图类型的图片,有没有好的 ocr 软件?最好支持导出成 excel
|
9
0bSer7er 2022-09-30 17:11:35 +08:00
最近正好在看 OCR ,阿里云有自定义排版的 api ,公司注册有免费额度,可以看一下
|
10
encro 2022-09-30 20:30:06 +08:00
|