V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
RickyC
V2EX  ›  问与答

访问记录里同一设备不停换 IP 怎么做到的?

  •  
  •   RickyC · 2020-11-25 09:50:56 +08:00 · 2710 次点击
    这是一个创建于 1490 天前的主题,其中的信息可能已经有所发展或是发生改变。

    2020-11-25 01:36:43 117.95.165.58 Mozilla/5.0(Linux;U;Android+5.1.1;zh-CN;OPPO+A33+Build/LMY47V)+AppleWebKit/537.36(KHTML,like+Gecko)+Version/4.0+Chrome/40.0.2214.89+UCBrowser/11.7.0.953+Mobile+Safari/537.36 200 0 0 325

    2020-11-25 01:36:44 117.95.166.209 Mozilla/5.0(Linux;U;Android+5.1.1;zh-CN;OPPO+A33+Build/LMY47V)+AppleWebKit/537.36(KHTML,like+Gecko)+Version/4.0+Chrome/40.0.2214.89+UCBrowser/11.7.0.953+Mobile+Safari/537.36 200 0 0 324

    这个 OPPO 手机一天可能刷上千上万, IP 也有很多很多 他怎么做到的?

    13 条回复    2020-11-25 12:44:10 +08:00
    zhs227
        1
    zhs227  
       2020-11-25 09:52:56 +08:00   ❤️ 3
    如果你会编程你就会发现这个 UA 是可以自己写的,写成阿猫阿狗也可以。对方说自己是个手机,不一定真的是个手机。
    Xusually
        2
    Xusually  
       2020-11-25 09:54:39 +08:00   ❤️ 1
    采集器的日常 UA 伪造+代理池
    WhiteSheep
        3
    WhiteSheep  
       2020-11-25 09:55:48 +08:00
    难道是 Tor ?(划掉
    RickyC
        4
    RickyC  
    OP
       2020-11-25 09:56:06 +08:00
    @zhs227
    @Xusually 那这个 IP 是真实的吗? 是 IIS 显示的
    raaaaaar
        5
    raaaaaar  
       2020-11-25 10:01:50 +08:00 via Android
    ua 可以坏,IP 有代理池
    meik2333
        6
    meik2333  
       2020-11-25 10:04:12 +08:00
    IP 可能是代理,UA 应该是伪造的,毕竟现在还是 Android 5.1 的手机已经不多了。
    Xusually
        7
    Xusually  
       2020-11-25 10:06:07 +08:00
    @RickyC 看情况吧,如果是采集的话,一般是真实的代理 ip 。如果是攻击的话,可能是伪造的。
    lbp0200
        8
    lbp0200  
       2020-11-25 10:09:59 +08:00
    都是真实的 IP 地址,某宝上很便宜的,自动随机切换 IP 地址。
    用 IP 地址区分爬虫? too young too simple
    qiayue
        9
    qiayue  
       2020-11-25 10:11:16 +08:00
    一个常识,相同厂家相同型号官方浏览器的 UA 都是相同的,所以根本就不应该用 UA 来认定唯一用户,UA 是一类设备的特征,不是某个特定设备的特征
    zhs227
        10
    zhs227  
       2020-11-25 10:13:34 +08:00
    IP 一直不停的变肯定是代理池。也就是说真实的 IP,但这个 IP 的拥有者(不?)清楚别人在用他的 IP 访问你的网站。这种一般都是爬虫在开采内容。和正常访问差不多,一般也不太容易区分出来。如果他愿意,不停的变换 UA 也是可以的
    shiro327
        11
    shiro327  
       2020-11-25 10:29:26 +08:00   ❤️ 3
    用长城宽带自带这个 buff
    worldtongfb
        12
    worldtongfb  
       2020-11-25 12:01:16 +08:00
    不知道谁写的爬虫,真的是沙雕一样,去重都不做,20w 的数据天天翻来覆去的爬,日志里面都是,统计都没法做了,
    就这几个 ua,
    ````
    Mozilla/5.0(Linux;Android 5.1.1;OPPO A33 Build/LMY47V;wv) AppleWebKit/537.36(KHTML,link Gecko) Version/4.0 Chrome/42.0.2311.138 Mobile Safari/537.36 Mb2345Browser/9.0
    Mozilla/5.0 (Linux; Android 7.0; FRD-AL00 Build/HUAWEIFRD-AL00; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/53.0.2785.49 Mobile MQQBrowser/6.2 TBS/043602 Safari/537.36 MicroMessenger/6.5.16.1120 NetType/WIFI Language/zh_CN
    Mozilla/5.0(Linux;Android 5.1.1;OPPO A33 Build/LMY47V;wv) AppleWebKit/537.36(KHTML,link Gecko) Version/4.0 Chrome/43.0.2357.121 Mobile Safari/537.36 LieBaoFast/4.51.3
    ````
    用 cf 的话这几个 ua 开验证,没有的话直接 nginx 里 ban 掉,他们 ip 都是重复拨号的把,在一个范围里波动,直接封 ip 段也行
    ````
    if ($http_user_agent ~* (wget|curl|python|mj12bot|Bytespider|DotBot|ahrefs|AL00|A33|2345|LieBao|petalbot) ) {
    return 403;
    }
    ````
    RickyC
        13
    RickyC  
    OP
       2020-11-25 12:44:10 +08:00
    @qiayue 问题这个相同的 UA 一天有好几万的访问数据, ip 有好几千个
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1246 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 17:50 · PVG 01:50 · LAX 09:50 · JFK 12:50
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.