仅供练习使用,代码注释很详细
收集了一些各大网站登陆方式, 和一些网站的爬虫程序,有的是通过 selenium 登录,有的是通过抓包直接模拟登录,有的是利用 scrapy,希望对小白有所帮助,本项目用于研究和分享各大网站的模拟登陆方式,和爬虫程序,会持续更新。。。
昨天加了个班,对一些老代码进行了重构和测试,大部分都可以用。
欢迎 star
模拟登陆基本采用的是直接登录或者使用 selenium+webdriver 的方式,有的网站直接登录难度很大,比如 qq 空间,B 站,如果采用 selenium 就相对轻松一些。
虽然在登录的时候采用的是 selenium,为了效率,我们可以在登录过后得到的 cookie 维护起来,然后调用 requests 或者 scrapy 等进行数据采集,这样数据采集的速度可以得到保证。
101
CriseLYJ OP 顶一下
|
102
guanhui07 2019-03-08 11:38:22 +08:00
赞一个
|
105
Zeham 2019-03-08 14:01:53 +08:00
大佬
|
106
airdge 2019-03-08 14:07:21 +08:00
qzone 有验证码 这里面好像没有验证码模块 放服务器用不了的
|
108
CriseLYJ OP 顶
|
109
veeupup 2019-03-08 14:52:31 +08:00
顶
|
111
CriseLYJ OP 顶一下在
|
112
fakeman 2019-03-09 00:21:16 +08:00
能研究下 google 的 requests 登陆方式么
|
114
pythonee 2019-03-10 18:07:01 +08:00
验证码是不是还是关键?
这些网站是否有一定频率或反爬措施,这些是怎么处理呢? |
116
ligthdawn 2019-03-11 10:50:26 +08:00
@konikoo 老哥我本地的电脑,使用浏览器都要滑动验证,滑几次都不好使。这还是没使用 selenium,pyppeteer 之类的
|
118
Sxxiong 2019-04-26 00:26:10 +08:00
想问一下大佬 有 google 登录的经验么? 这几天卡在验证码那块了 谢谢
|