V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
yqf3139
V2EX  ›  问与答

怎么简单地获得一个博客的所有博文(摘要)?

  •  
  •   yqf3139 · 2014-02-17 13:35:48 +08:00 · 2820 次点击
    这是一个创建于 3959 天前的主题,其中的信息可能已经有所发展或是发生改变。
    本来以为RSS可以全部获得的,但会有条数限制。阅读器对冷门博客也没办法获得更多。

    除了遍历爬取之外有没有什么其他的办法?
    5 条回复    1970-01-01 08:00:00 +08:00
    geeklian
        1
    geeklian  
       2014-02-17 13:42:42 +08:00 via iPhone   ❤️ 1
    wordpress应该支持/feed/?paged=2这种。

    很多阅读器向下拉就能取下一页的内容
    lifanxi
        2
    lifanxi  
       2014-02-17 13:50:43 +08:00
    以前的话,如果这个博客在Google Reader曾经有人订阅过的话,可以从Google Reader获取Google Reader上曾经抓取到的所有内容。

    现在没有Google Reader了,不知道别家的阅读器有没有哪家提供这样的功能的。不行就只能自己爬了。
    lifanxi
        3
    lifanxi  
       2014-02-17 13:53:36 +08:00
    试了一下一楼的方法,对WordPress确实有效,不错,不过估计不太通用。
    yqf3139
        4
    yqf3139  
    OP
       2014-02-17 14:02:41 +08:00
    本来有个想法,想自己以后实训的时候做的。

    经常能在搜索的时候发现很不错的博客。除了搜到的和最近发表的博文,其他老的文章也想仔细阅读,但一下子读完是个很耗时的事情。就想有这么一个服务:

    1,添加想读的博客,生成一个新的私人RSS源(同时提供在线网站和接入类似杂志应用的服务),有规律地更新自己没读过的文章摘要,如果想读文章的话点击链接到文章,并也就相当于标注这篇文章读了。
    2,添加的要读的博客数量不能太多,阅读进度可以查看,博客文章可以根据时间,内容过滤,更新频率可以定制。
    3,博主可以认领博客,然后可以做一些推荐,排序。

    是不是只有掌握很多博文信息的网站才能做这个,有没有人有类似的需求?
    tearsinchina
        5
    tearsinchina  
       2014-02-17 14:23:18 +08:00
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2692 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 14:31 · PVG 22:31 · LAX 06:31 · JFK 09:31
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.