V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
dada88xyxy
V2EX  ›  程序员

请教一下大伙是怎么样保存互联网文章?

  •  3
     
  •   dada88xyxy · 2023-05-18 15:53:09 +08:00 · 13963 次点击
    这是一个创建于 580 天前的主题,其中的信息可能已经有所发展或是发生改变。

    经常会遇到一个事儿,在 pc 的时候,感觉需要保存的文章会收藏在浏览器里面,然后下次就可以点击访问。但是这样会遇到 2 个问题,1 个是 404 了;另外 1 个是不能全文搜索,有时候不记得在哪个网站,只记得某个关键词,想搜索可以找出来。

    在手机浏览器、微信看到的文章亦是如此,请教各位有什么好方式?

    需求:离线保存;全文搜索

    128 条回复    2024-03-05 10:47:07 +08:00
    1  2  
    AItsuki
        101
    AItsuki  
       2023-05-19 14:32:37 +08:00
    对不起,我上一条回答和标题关系不大……
    现在我重新回答:本贴的大部分回复都没考虑到手机上使用的情况,推荐的基本都是 pc 端浏览器插件。

    所以我推荐使用 GetPocket ,阅读公众号,或者阅读网页,直接分享到 getpocket 就可以了。如果需要离线保存,需要 PREMIUM 版本(一年 280 )
    pigf
        102
    pigf  
       2023-05-19 14:49:23 +08:00
    有道云笔记,复制了一个链接之后会提示你是否要抓取整个页面的内容,非常好用。
    pendulum
        103
    pendulum  
       2023-05-19 15:58:30 +08:00
    hamsterbase 应该能满足你的要求
    garipan
        104
    garipan  
       2023-05-19 16:00:19 +08:00
    @fengjianxinghun #27 哈哈 但比起其它公司或服务,Google 提供的已经算是非常长寿的了,不是吗……而且关闭之前都可以导出来
    pendulum
        105
    pendulum  
       2023-05-19 16:01:45 +08:00
    @hamsterbase #76 期待上线用户管理功能,或者其他方式来保障公网部署服务的安全性
    Yunen
        106
    Yunen  
       2023-05-19 16:03:57 +08:00
    VPS 自建 ArchiveBox
    debuggeeker
        107
    debuggeeker  
       2023-05-19 17:05:04 +08:00
    用 md 插件把文章下载,然后通过 py 脚本对文章中图片下载的本地替换 md 中远程的图片。
    再配合 SingleFile 下载一个 HTML 的。
    如果图片真的下不了,就没办法了,图片只能手动下载。
    然后放网盘分类。
    hamsterbase
        108
    hamsterbase  
       2023-05-19 17:07:48 +08:00 via Android
    @pendulum 这个不是 hamsterbase 的职责。

    如果要暴露到公网,可以在外面套 nginx

    如果是想随时访问,可以用 tailscale
    jieran233
        109
    jieran233  
       2023-05-19 17:24:27 +08:00
    浏览器插件 SingleFile ,要搜索的话就用 vscode 打开文件夹搜索

    还有一个 https://webrecorder.net/ ,个人用过最强的网页捕获回放工具,适合捕获各种复杂的动态网页,可以做私人的 web.archive.org
    thiiadoewjwe
        110
    thiiadoewjwe  
       2023-05-19 17:25:45 +08:00
    有道云笔记
    alfawei
        111
    alfawei  
       2023-05-19 17:37:25 +08:00 via iPhone
    @zololiu iOS 手机没有好用的客户端
    kawaii303
        112
    kawaii303  
       2023-05-19 18:09:26 +08:00 via iPhone
    @toloric notion 的网页剪藏不好用,只能剪藏网址,不能保存原文,相对来说,印象笔记剪藏效果最好。
    fresco
        113
    fresco  
       2023-05-19 20:08:35 +08:00 via iPhone
    论体验的话 cubox 不错
    sparkinglemon
        114
    sparkinglemon  
       2023-05-19 20:08:37 +08:00
    前一阵从 V 友这儿学会的,Safari ,分享到“图书”app ,也能直接生成离线版,方便好用
    abc8678
        115
    abc8678  
       2023-05-20 07:55:34 +08:00 via Android
    一开始我也只是保存个浏览器书签,结果后来打不开了。再搜也可能搜不到原文。然后也养成了保存教程的习惯
    suibianzai
        116
    suibianzai  
       2023-05-20 09:08:38 +08:00
    我也是用 singlefile 保存 html 上百篇文章仍在网盘一个文件夹里 现在的问题是没办法方便地搜索、查看 于是文章保存下来后就在网盘里吃灰 网上找了找也没有合适的工具 楼里一位朋友做的工具去试用了一下 总感觉不得劲儿 而且个人产品还是不太放心 这类工具最好是能靠谱一点的公司来做
    suibianzai
        117
    suibianzai  
       2023-05-20 10:33:39 +08:00
    @suibianzai #116 补充一下 很多人提到 SingleFile 结合桌面搜索软件( anytxt searcher/archivarius 等,知乎上搜到一篇比较全面的评测 https://zhuanlan.zhihu.com/p/371466155?utm_id=0 )的做法是个不错的选择 缺点是只适用于个人电脑 移动端或者换台设备就不行了
    mauve
        118
    mauve  
       2023-05-20 15:41:32 +08:00 via iPhone
    @TabGre 自带的 clip 不太好用,具体表现在:
    1. 排版经常混乱,无论 md 还是 pdf 等
    2. 剪切后的文件体积略大,相对于 singlefile 来说
    3. 绘图或者标记功能弱

    转 pdf 的工具是 DEVONThink 自带的,右键一下文件然后选择 convert to pdf ,我一般转成单页的
    TabGre
        119
    TabGre  
       2023-05-20 16:14:09 +08:00 via iPhone
    @mauve 感谢分享,另外 singleFile 可以配置直接到 devonthink 吗?我看了一次 配置没有找到
    mamili
        120
    mamili  
       2023-05-22 10:19:50 +08:00
    @shuxhan 很好用,感谢~
    eudemonwind
        121
    eudemonwind  
       2023-05-26 01:12:30 +08:00
    直接 ctrl+S 保存 mhtml 就一单个文件
    chrome 和 firefox 都有相关设置和插件.
    检索时用 everything 直接搜文件名,
    重要点的会用 onenote 摘录一下
    woyaojizhu8
        122
    woyaojizhu8  
       2023-06-10 22:09:56 +08:00
    @mauve
    >SingleFile 配合插件自动到 DEVONThink 的 Inbox
    这里的 插件 是 devonthink 的插件吗?具体是什么插件?
    >最后用上 ocrmypdf 脚本转换一些不能被检索到的文字
    devonthink 自带的 ocr 不能满足需求吗?
    mauve
        123
    mauve  
       2023-06-10 22:30:20 +08:00
    @woyaojizhu8 不好用而且我没买高级版,识别出来的结果并不好
    Mickeyy
        124
    Mickeyy  
       2023-08-29 21:03:54 +08:00
    @mauve #43 马克一下这套操作
    Rookie01
        125
    Rookie01  
       2023-08-31 13:36:34 +08:00
    @LavaC #80 请教一下,为什么我保存微博页面,然后网页内容里的图片和评论区的用户头像都不显示呢?
    LavaC
        126
    LavaC  
       2023-08-31 13:55:40 +08:00
    @Rookie01 设置的网络里把图片选项勾勾?
    SachinBeyond
        127
    SachinBeyond  
       291 天前
    @foxio2 老哥,现在还在用 singlefile 吗? 感觉这个的缺点是后期无法天机哎备注?
    hanssx
        128
    hanssx  
       288 天前
    singleFile 什么时候能加上可以选择文件夹和预览、搜索就牛啤了。
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1017 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 20:53 · PVG 04:53 · LAX 12:53 · JFK 15:53
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.