V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
vzlf
V2EX  ›  问与答

关于这个想法的指导

  •  1
     
  •   vzlf · 2017-05-25 23:01:37 +08:00 · 1369 次点击
    这是一个创建于 2738 天前的主题,其中的信息可能已经有所发展或是发生改变。

    有这么个想法,比如我用 github 的 issues 来写 blog,现在我想把我的 blog 文章给爬取下来,整合成一个静态的博客网页。(加速访问速度) 这样的话,是相当于做一个爬虫么?并且在 issues 修改后,能同步的修改这个“镜像站”的内容 (第一阶段我准备就做个定时器,定时爬取,后面查查看 github 应该有这方面的 api 吧?再完善下。)

    我想,第一步我应该是要先学习怎么写个爬虫吧,不知道 v 友有没有这样的爬虫小 demo 给一个参考,或者相关的文章指导一下。

    Java 最好了,别的语言借鉴也行(我知道 python 有很多,也很方便,不过主要是想借着这个项目的机会来锻炼下 javaweb 的= =,多谢 V 友了

    1 条回复    2017-05-26 12:32:59 +08:00
    vzlf
        1
    vzlf  
    OP
       2017-05-26 12:32:59 +08:00
    怎么都没有 v 友呢....
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2929 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 03:39 · PVG 11:39 · LAX 19:39 · JFK 22:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.