1
soho176 2018-05-26 22:30:09 +08:00
抖音 app 咋抓的?
|
3
chengxiao 2018-05-26 22:33:18 +08:00
这种带加密校验的 不知道服务端加密方法的话 很难破解吧
可能只有反编译去找加密方法了 |
4
lwj253698 OP @chengxiao 真的是加密吗。。。能不能绕过它呀 我现在看到的每一个 url 后面都是加了这几个属性的,唯独分享时的那个 url 好像没有
|
6
soho176 2018-05-26 23:00:43 +08:00
问一下站长啊,我就在本贴回复了一下,为啥我的 ip 被封了?我的联通宽带分配的固定 ip,结果现在就是无法访问了
|
7
402124773 2018-05-26 23:02:30 +08:00
这种 app 在客户端这边也都是有加密的。例如,你抓客户端登陆,肯定不是 post 用户名和密码。而是加密后的东西。现在很多 app 大部分代码都在 so 库里面。
|
8
playniuniu 2018-05-26 23:15:09 +08:00 via iPhone 2
抖音的 app 是经过加密签名的 加密函数好像在 libuser.so 里面 网上有一篇详细分析加密过程的教程 可以参考一下
|
9
nine99 2018-05-26 23:19:00 +08:00
先用抓包工具的重放一遍那个请求看看 ,一般都是你的 python 发的请求在细节上和它原来的不一样导致的。如果 确定一样也不行,你再逆向下,看这几个参数怎么来的。
|
10
nine99 2018-05-26 23:20:53 +08:00
实在不行就直接用 hook 的方法来爬吧。
|
11
lwj253698 OP @playniuniu 好的!!谢谢
|
12
lwj253698 OP @nine99 我直接赋值那个包的 url 然后用 get 方法获得 response 的 json...如果这个都不一样的话我是真的不知道还有什么可能了
|
13
lwj253698 OP 刚刚发现一个问题,我猜抖音对指令应该是向前兼容的,也就是说有一些疑似为校验的参数貌似不赋值居然也可以... 参见 http://(hhhh)cuijiahua.com/blog/2018/03/spider-5.html/comment-page-1/#comments
|
14
lwj253698 OP = =实在是浪费了我六七个小时呢
|
15
empty9 2018-05-27 01:26:22 +08:00
之前研究过,逆向了他们 apk 实际上很简单,唯一坑的地方是有的 api 都是要求你登录,并验证 cookies。
|
16
fange01 2018-05-27 01:27:23 +08:00
若若的问一句,是爬抖音的视频,导入其他平台做流量吗》?
|
17
patx 2018-05-27 01:33:51 +08:00 via Android
抖音我没试过,其他的视频网站只会对 url 参数做签名。
|
18
k00baa 2018-05-27 03:26:21 +08:00
apk 逆向,然后 hook,那些参数就出来了
|
19
locktionc 2018-05-27 08:32:36 +08:00
as,cp, mas 的算法请看这里:![]( http://7sbpmp.com1.z0.glb.clouddn.com/2018-05-27-08-28-44.png)
_rticket 只需要根据它的格式随机生成一个字符串即可,也可以省略。 |
20
myliyifei 2018-05-27 08:50:21 +08:00 via Android
有一个人分享的抖音 url,因为名字的原因。我想从 url 分析,找到这个人的抖音 id,可以吗
|
21
WinMain 2018-05-27 10:01:12 +08:00
github 上有一个很好用的,为了做视频分类,已经爬了十来万视频了。。
https://github.com/LoadChange/amemv-crawler |
22
nine99 2018-05-27 10:44:10 +08:00
header 的参数设了吗
|
23
peterpei 2018-05-27 10:46:28 +08:00 via Android
@myliyifei 同样有这样的思路,借鉴了抖音 id 长度并没有发现有相同长度的 id 号,看起来是加密了。。。
|
25
lwj253698 OP @WinMain 其实我对这个分类倒是不是太在意。。。因为我接下来还会做一些筛选,打算用 opencv 筛选出只有人像上半身的视频
|
31
lwj253698 OP @locktionc emmm 其实我发现其实只要把这几个参数全部省略掉就可以访问了,也是很奇怪了
|
32
KomeijiSatori 2018-05-27 15:22:16 +08:00
|
33
locktionc 2018-05-27 16:13:38 +08:00
@lwj253698 不能省略,因为一旦省略,他们就知道这不是正常的 App 请求。于是就可以封你。即使你用代理每一次请求都换,他也可以来一次封一次。省略了以后你的爬虫就是去送死。
|
35
bankroft 2018-06-06 20:09:45 +08:00
我的博客写过抖音全站爬虫,发不了链接,百度搜索 bankroft
|
36
wjx1993 2018-06-21 23:21:26 +08:00
为什么抖音我都抓不到包?
|
37
cjcgynpu 2018-06-26 12:41:32 +08:00
嗯, 去哪儿前反爬虫工程师去了头条。
只能说这么多了。 |
39
Trinity888 2022-05-18 13:50:29 +08:00
@lwj253698 楼主,现在抖音 App ,还能爬虫获取数据吗?
|