V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
plprapper
V2EX  ›  奇思妙想

有人对收藏夹收藏的网页内容搜索 有需求吗?

  •  
  •   plprapper · 2013-10-02 17:52:47 +08:00 · 4692 次点击
    这是一个创建于 4074 天前的主题,其中的信息可能已经有所发展或是发生改变。
    我个人收藏夹里有两百多个网页,收藏了一些技术文章,还有一些乱七八糟的网站。

    东西多了,找起来非常麻烦。

    尤其是模糊的印象里,曾经收藏过,但是记不住是哪个。

    自己写了个简单的shell + phantomjs的工具抓下来 收藏夹里的网页,然后grep一下。

    不知道其他人是不是有这种需求。



    另外:
    十一之后想找分工作呀,之前开了帖子,木有人联系我,好凄凉。 再次求包养。
    第 1 条附言  ·  2013-10-03 11:00:17 +08:00
    https://github.com/peiliping/nodejs/tree/master/phantomjs/favclaw

    这里是shell + phantomjs 运行需要有phantomjs哦 记得修改一下main.sh里面的路径

    运行是 sh main.sh xxx 20131003 bookmarks_13-10-2.html ##目前支持的是chrome的收藏夹导出文件

    运行会产生一个文本文件 xxx-20131003

    singleclaw.js 是用来爬指定url的网页text的。

    sh search.sh 足球 xxx-20131003 ##用来搜索的脚本 打印包含关键词的行,还有收藏的url。



    code写的很粗糙,随手写的,能用就好了。
    14 条回复    2016-04-01 17:42:06 +08:00
    crazybubble
        1
    crazybubble  
       2013-10-02 23:15:55 +08:00   ❤️ 1
    有这需求,你的方法是指把收藏夹里的url都访问一遍抓取内容,然后grep关键词?我在想其实可以把内容抓取下来之后放到Solr之类的搜索引擎里,这样不知道是不是能更好的query到我收藏过的内容
    plprapper
        2
    plprapper  
    OP
       2013-10-03 00:00:54 +08:00
    之所以grep 是因为我自己用 简单而已嘛。

    只是一些零散的脚本 所以没有用solr这么复杂。

    如果有一些人有这个需求 做个简单的小产品 挂在那里 那个时候会考虑搜索到底用什么引擎 用什么分词了。

    我以前也在找一些类似的东西 一直没找到 以为chrome会做这个事,不过貌似到现在也没有这个迹象 。

    所以就自己动笔写了。
    plprapper
        3
    plprapper  
    OP
       2013-10-03 00:01:15 +08:00
    @crazybubble 额 。。。。忘记圈你了
    reloop
        4
    reloop  
       2013-10-03 03:16:20 +08:00   ❤️ 1
    这个如果是浏览器扩展会更好吧
    一直有这个需求
    以前 抽屉网 可以保存快照 但不能搜索正文
    jianfa
        5
    jianfa  
       2013-10-03 09:45:01 +08:00   ❤️ 1
    以前同样也有LZ这样的强烈需求,现在在用 Holmes: https://chrome.google.com/webstore/detail/holmes/gokficnebmomagijbakglkcmhdbchbhn ;内容索引还是用Evernote这类工具吧.
    plprapper
        6
    plprapper  
    OP
       2013-10-03 09:53:46 +08:00
    @jianfa 以前用过wiz来记录,后来直接保存在blog里。不过用知识管理工具,经常有要整理一下的冲动,也许是强迫症吧。我现在更愿意使用收藏夹或者写到blog里。
    yangqi
        7
    yangqi  
       2013-10-03 09:56:29 +08:00   ❤️ 1
    网页收藏到evernote里就可以搜索了, 新的evernote chrome extension很好用的说
    plprapper
        8
    plprapper  
    OP
       2013-10-03 10:14:09 +08:00 via iPhone
    @yangqi 嗯 有空试试
    anheiyouxia
        9
    anheiyouxia  
       2013-10-03 11:05:26 +08:00
    现在我用麦库的了~~
    一般常用的才放收藏夹,技术文章什么的,还会用麦库保存一次~~
    54xiaobin
        10
    54xiaobin  
       2013-10-06 17:00:43 +08:00
    有 很必要
    plprapper
        11
    plprapper  
    OP
       2013-10-06 17:40:51 +08:00
    @54xiaobin 呵呵 可以试用一下
    Aoliz
        12
    Aoliz  
       2013-11-12 21:27:45 +08:00
    Chrome 书签管理器里可以搜索;
    +美味书签
    wanshanju
        13
    wanshanju  
       2014-05-31 00:34:41 +08:00
    evernote, 为知笔记, 也可以使用 cang.baidu.com
    syslykk
        14
    syslykk  
       2016-04-01 17:42:06 +08:00
    很好的想法,不过 firefox 的 scrapbook 就可以抓取收藏夹的网页
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2689 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 15:41 · PVG 23:41 · LAX 07:41 · JFK 10:41
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.