V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
zhangslob669
V2EX  ›  Python

拼多多&网易爬虫面试

  •  
  •   zhangslob669 · 2019-06-24 22:30:59 +08:00 · 9810 次点击
    这是一个创建于 2013 天前的主题,其中的信息可能已经有所发展或是发生改变。

    拼多多&网易爬虫面试

    下周入职拼多多

    44 条回复    2019-07-05 02:27:48 +08:00
    polebug
        1
    polebug  
       2019-06-24 22:34:42 +08:00
    不错~感谢分享~
    snoopy1024
        2
    snoopy1024  
       2019-06-24 23:05:08 +08:00
    应届毕业生,感觉技术部分问得没有想象中的那么难、多... 感谢分享
    capo
        3
    capo  
       2019-06-24 23:36:50 +08:00
    赞,很用心的文档,Scraoy Selectors 的大标题有一点小错误,祝大佬入职顺利~
    Dart
        4
    Dart  
       2019-06-24 23:52:30 +08:00
    大公司带头搞数据采集啊
    Dart
        5
    Dart  
       2019-06-24 23:53:27 +08:00
    刺裸裸的剥削啊
    WhoMercy
        6
    WhoMercy  
       2019-06-25 00:57:34 +08:00 via Android
    pdd 要的钱够多吗?
    以那加班强度,得把以后治病的钱赚回来(笑
    Mistwave
        7
    Mistwave  
       2019-06-25 01:41:02 +08:00 via iPhone
    11116
    比 965 高几倍?
    tangbao
        8
    tangbao  
       2019-06-25 07:49:36 +08:00
    砍完了文章,貌似网易比拼多多要水啊。。。。真是不敢相信。。。
    steveway
        9
    steveway  
       2019-06-25 08:54:29 +08:00 via Android
    龟龟 11116
    boom7
        10
    boom7  
       2019-06-25 09:09:32 +08:00 via Android
    11116 我的天,早上出门,晚上回到家都第二天了
    onlineismy
        11
    onlineismy  
       2019-06-25 09:13:27 +08:00
    小黑鱼的啊
    collector
        12
    collector  
       2019-06-25 09:19:24 +08:00
    11 11 6 有点厉害,想知道楼主几年经验?这些厂对学历要求高吗
    Spoter
        13
    Spoter  
       2019-06-25 09:23:28 +08:00
    hr 面是最傻逼的,妈的,沙雕 hr,用人部门都确定了,你在那里显摆什么,问的有些没的,又不懂业务,在那里装懂,浪费时间
    xctcc
        14
    xctcc  
       2019-06-25 09:25:30 +08:00
    11 11 6,估计工资高到楼主无法拒绝了
    hyy1995
        15
    hyy1995  
       2019-06-25 09:37:27 +08:00
    看到 11 11 6 顿时跪了,这条路真难走。。。
    x86
        16
    x86  
       2019-06-25 09:39:22 +08:00
    单身的我来说,钱到位就行了...
    gunjianpan
        17
    gunjianpan  
       2019-06-25 09:53:33 +08:00
    我多竟然开始招爬虫岗了
    Northxw
        18
    Northxw  
       2019-06-25 09:54:31 +08:00
    - **安卓逆向**,到底该从哪里搞起啊,有没有教程或者方法,麻烦各位 v 友推荐下。
    - **验证码识别(tf 训练)**, 之前用过 python 的三方库,效果不敢恭维;后面基本就接入打码平台了,面试时才发现,技术官基本不鸟这些,人家要实实在在的自己实现的方法,比如机器学习的算法训练识别,这里也有大致的路线介绍吗?

      自学之路很崎岖,劳烦各位指点迷津。
    collector
        19
    collector  
       2019-06-25 09:57:40 +08:00
    @Northxw 打码平台不应该更方便吗?难道还非得自己搞机器学习才可以?
    SpiderXiantang
        20
    SpiderXiantang  
       2019-06-25 10:05:52 +08:00
    作者不是知乎大 v 吗 为啥要去拼多多呀
    Northxw
        21
    Northxw  
       2019-06-25 10:10:12 +08:00
    @collector 你错了,正儿八经的爬虫技术部门,肯定要自己的算法实现(区别并独立于别人的代码),这些代码就是价值,因为我有的你没有,效率和效益会更高。
    collector
        22
    collector  
       2019-06-25 10:16:31 +08:00
    @Northxw 那这就不是单纯的搞爬虫了吧,应该有专门的团队去做这件事,这是数据那边的工作才对
    ZehaiZhang
        23
    ZehaiZhang  
       2019-06-25 10:16:49 +08:00
    牛逼就完事儿了
    Northxw
        24
    Northxw  
       2019-06-25 10:28:56 +08:00
    @collector 高级爬虫工程师了趴,反正突破不了屏障,爬虫也寸步难行啊,所以要做爬虫,这些都是日后需要搞得
    MuscleOf2016
        25
    MuscleOf2016  
       2019-06-25 10:30:31 +08:00
    牛逼
    soulmine
        26
    soulmine  
       2019-06-25 11:32:58 +08:00
    居然感觉 PDD 的问题很水 不过 11 11 6 这得总包多少啊
    dany813
        27
    dany813  
       2019-06-25 12:21:14 +08:00
    大佬厉害
    hyfgreg
        28
    hyfgreg  
       2019-06-25 13:53:09 +08:00
    PDD 11 11 6 的 6 都是给钱的,这点稍微好点,不过节日强制加班有点。。。
    claymore94
        29
    claymore94  
       2019-06-25 14:18:12 +08:00
    有点疑问,为什么都问到了逆向?
    Raymon111111
        30
    Raymon111111  
       2019-06-25 14:27:29 +08:00
    拼多多应届生可以给到 40w
    rffan
        31
    rffan  
       2019-06-25 14:30:18 +08:00
    吓得我瑟瑟发抖,里面很多东西不会,关键是固执的不想用 scrapy。
    zhangslob669
        32
    zhangslob669  
    OP
       2019-06-25 15:12:51 +08:00
    @claymore94 因为在简历中写到了这点,是加分项
    zaul
        33
    zaul  
       2019-06-25 15:14:20 +08:00
    拼多多啊,想啥呢
    zkqiang
        34
    zkqiang  
       2019-06-25 15:17:37 +08:00
    恭喜大佬拿到高薪 offer,用过大佬 github 那个代理池项目
    U87
        35
    U87  
       2019-06-25 16:09:41 +08:00
    请问你文档中给的实战题 模拟登陆美团有没有源码,这边没有解决
    zhangslob669
        36
    zhangslob669  
    OP
       2019-06-25 16:23:51 +08:00
    @zkqiang 我好像没有开源代理池啊
    beastk
        37
    beastk  
       2019-06-25 17:26:25 +08:00 via iPhone
    @zhangslob669 #36 感觉是车祸现场,哈哈哈
    nooper
        38
    nooper  
       2019-06-25 21:00:02 +08:00
    多钱年薪?
    oIMOo
        39
    oIMOo  
       2019-06-25 21:49:44 +08:00
    目录少了个 x
    -> Linu/Mac 下虚拟内存
    terryops
        40
    terryops  
       2019-06-25 21:58:04 +08:00
    妈耶,这太难了……
    想一想我自诩的「熟悉爬虫技术」是多么的浮浅。
    iblislsy
        41
    iblislsy  
       2019-06-26 09:48:15 +08:00
    pdd 的爬虫如果爬竞争对手的数据..被发现了了会不会小弟背锅
    zhuke945
        42
    zhuke945  
       2019-06-26 10:10:27 +08:00
    拼多多的爬虫是做啥,电商类的吗
    Takamine
        43
    Takamine  
       2019-06-26 12:47:04 +08:00 via Android
    11116 我愣是看了半天,可怕。_(:з」∠)_
    wanwenhua
        44
    wanwenhua  
       2019-07-05 02:27:48 +08:00
    我想问,最近拼多多反爬这么严。是你整的鬼吗?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2700 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 12:35 · PVG 20:35 · LAX 04:35 · JFK 07:35
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.