自动识别并填写 V2EX 注册 / 登录 / 重设密码 等页面的验证码
V2EX 的验证码的设计在 阻挠肉眼识别 和 便于模式识别 两方面都达到了很高的水准。前者无需赘言,后者用之前项目做过的本地模式识别库简单测试,识别率非常高。
前者使这个功能成为一个迫切的需求,后者使自动识别成为技术上的可能,但还仅仅是可能。
但最重要的一点是,当验证码地址 https://www.v2ex.com/_captcha?once={number} 和 Cookie 不变的情况下,可以反复获取文字相同,但是重绘过的图片。
To build the project you need to run the following node commands:
npm install -g @angular/cli gulp
npm install
gulp
因为有 node-sass 的依赖,而 node-sass 又需要 node-gyp
node-gyp 在 Windows 上 Build 需要 Python 2.7 和 Visual C++ Build Tools
不想安装环境或者不想 Build 的,可以直接到 Release 下载扩展包,在 扩展页面 chrome://extensions/ 加载已解压的扩展程序即可。
1
koodai 2017-11-28 00:41:49 +08:00 via Android
服!贵在思路
|
2
freed 2017-11-28 01:06:34 +08:00
赞~
|
3
EchoChan 2017-11-28 01:08:10 +08:00 via Android
有意思,这验证码,虽然不算差,但体验真不好。
|
4
zhigang1992 2017-11-28 01:55:23 +08:00 2
阻挠肉眼识别 和 便于模式识别 lol
|
5
vipper 2017-11-28 07:33:25 +08:00 via iPhone
用这种是不是要比打码便宜很多
|
6
wellsc 2017-11-28 09:00:23 +08:00 via iPhone
👍
|
7
ty89 2017-11-28 11:03:33 +08:00
v2 这种验证码就只能摆个样子,用投影法切分成单个字符再稍微调整尺寸和位置,再丢给 ocr 就搞定了。
防机器识别最重要的几点统统不具备: 1 )字体重叠粘连 2 )背景干扰 3 )字体扭曲 |
8
dotpig 2017-11-28 12:49:38 +08:00
“阻挠肉眼识别” 和 “便于模式识别” 的意思是不是给真人麻烦,给机器人方便的意思?
|
9
SoloCompany 2017-11-28 12:52:55 +08:00 via iPhone
然而我只用 gg 登录
|
10
myself659 2017-11-28 14:37:44 +08:00
验证码影响用户体验,又解决不爬虫 是不是可以被淘汰了
|
11
soulmine 2017-11-28 20:40:26 +08:00
@myself659 不是 至少有了验证码会让很大一部分写爬虫的感觉很日狗 说不定就跳过了 至少我是这样 当然假如什么非爬不可的 就另说了 www
|
12
AnyISalIn 2017-11-29 10:49:10 +08:00
思路不错
|