V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
realfreesky
V2EX  ›  程序员

验证码 OCR 识别工具都有哪些比较好用呀

  •  
  •   realfreesky · 2017-09-26 14:22:08 +08:00 · 3150 次点击
    这是一个创建于 2620 天前的主题,其中的信息可能已经有所发展或是发生改变。
    最近需要研究一款验证码的安全性,求大家给点建议,谢谢啦
    8 条回复    2017-09-27 09:02:34 +08:00
    panpanpan
        1
    panpanpan  
       2017-09-26 14:29:41 +08:00   ❤️ 1
    tesseract
    xmbaozi
        2
    xmbaozi  
       2017-09-26 14:32:07 +08:00
    前段时间也是研究这个。
    直接到一些提供验证码服务的网站测试
    realfreesky
        3
    realfreesky  
    OP
       2017-09-26 14:42:21 +08:00
    @xmbaozi 有网站推荐不
    xmbaozi
        4
    xmbaozi  
       2017-09-26 14:53:01 +08:00
    验证码识别 搜索下
    Revenant
        5
    Revenant  
       2017-09-26 16:54:38 +08:00
    提供验证码平台好多是人工打码的,我同事的老婆坐月子的时候就在打码平台赚外快
    gengfire
        6
    gengfire  
       2017-09-26 17:05:09 +08:00
    zgbgx1
        7
    zgbgx1  
       2017-09-26 17:14:14 +08:00
    图片 验证码 这东西,越来越难作为 图灵测试的工具了
    Marsss
        8
    Marsss  
       2017-09-27 09:02:34 +08:00
    看楼主提到 OCR,那么应该说的是图片字符类型的验证码。三种建议:
    1.比较清晰简单的那种,直接 tesseract。
    2.上 cnn (卷积神经网络),需要标注样本,自己去标注的话,眼睛会瞎的,样本数量起码需要万级左右,可以借助打码平台,需要一定的费用。
    3.使用简单的 mlp (多层感知器),也就是普通的神经网络,针对要识别的验证码,设计一种有效的切割算法,将字符进行切割,这种方法只需要标注几百张样本,就可以达到比较好的效果。几百张自己就搞定了,不需要产生费用。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2293 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 16:13 · PVG 00:13 · LAX 08:13 · JFK 11:13
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.