V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
kebamt
V2EX  ›  问与答

迫于互联网上文章被删,求大家存档工具

  •  1
     
  •   kebamt · 2021-08-24 09:34:25 +08:00 via iPhone · 6161 次点击
    这是一个创建于 1178 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近有一个烦恼,就是自己收藏下来的文章由于各种原因被原作者删除或修改,导致链接失效变成 404 。 有没有一个工具把网页文章内容存档并支持分享(最重要的是能分享),就是你给它输入「文章链接」它把这个链接打印到网页并返回一个可分享文章链接(内容跟原始网页一摸一样的那种),最好是基于 Web,可以为此付费。 试过 Telegraph 不过需要自己一个一个自己搬运,TG 上也看到一些机器人可以把文章打印到 Telegraph 返回链接的,但此原始文章中的图片都没打印出来,都消失了,只有文字。

    42 条回复    2021-08-26 11:44:31 +08:00
    yujiang
        1
    yujiang  
       2021-08-24 09:37:42 +08:00 via Android
    Google/百度快照
    morisakitaku
        2
    morisakitaku  
       2021-08-24 09:39:14 +08:00 via iPhone
    網頁存檔
    cco
        3
    cco  
       2021-08-24 09:41:13 +08:00
    webarchive dot org
    4ark
        4
    4ark  
       2021-08-24 09:41:18 +08:00 via iPhone
    web archive
    40EaE5uJO3Xt1VVa
        5
    40EaE5uJO3Xt1VVa  
       2021-08-24 09:44:20 +08:00
    没遇到这么一劳永逸的工具.

    现在用欧鹏浏览器遇到好文档一键保存为 pdf
    gesse
        6
    gesse  
       2021-08-24 09:46:10 +08:00
    一般一篇文章你用到的知识点、信息点应该不多, 可以试着复制到笔记软件里总结归类下。

    方便以后的查阅、学习。
    minikyu
        7
    minikyu  
       2021-08-24 09:52:01 +08:00
    印象笔记、语雀、notion 之类的笔记软件都有剪藏功能的,直接保存在笔记里
    phony2r
        8
    phony2r  
       2021-08-24 09:54:13 +08:00   ❤️ 1
    cmd + p 打印成 pdf 文件
    oddcc
        9
    oddcc  
       2021-08-24 10:29:53 +08:00   ❤️ 1
    前两天刚自建了 https://github.com/ArchiveBox/ArchiveBox
    很强大
    webshe11
        11
    webshe11  
       2021-08-24 10:50:15 +08:00
    著名的老牌
    https://web.archive.org/save

    或者
    https://archive.today/

    功能特性 用法各有千秋 个人比较喜欢后者
    kebamt
        12
    kebamt  
    OP
       2021-08-24 12:03:20 +08:00
    @yujiang Google 快照好像早已下线了,输入搜索到的 Google 快照链接会自动重定向到 Google 首页。百度快照好像也死掉了
    kebamt
        13
    kebamt  
    OP
       2021-08-24 12:06:33 +08:00
    @mokeyjay 试了一下这两个后面的插件很不错,唯一缺点是不能网页的形式分享。

    http://web.archive.org/ 这个存完发现部分图片丢失,不知道怎么回事儿
    kebamt
        14
    kebamt  
    OP
       2021-08-24 12:08:33 +08:00
    @webshe11 谢谢,后者存档很完整几乎跟原网页一样,只是生成时间较长,不过可以接受
    v2ka
        15
    v2ka  
       2021-08-24 12:39:20 +08:00   ❤️ 1
    特意研究了下几种保存网页的方法。

    1-保存为 PDF 。(打印-保存 PDF )

    2-保存为离线网页( SingleFile )

    3-云笔记剪藏(印象笔记、onenote )

    4-稍后阅读工具( Pocket,高级版可以保存网页)
    kebamt
        16
    kebamt  
    OP
       2021-08-24 13:10:17 +08:00
    @v2ka 谢谢
    locoz
        17
    locoz  
       2021-08-24 13:49:09 +08:00 via Android   ❤️ 2
    @gesse #6 其实这样还是不太好,因为一篇文章你在不同水平、不同时期看可能会看出不同的东西,理解深度和联想的广度都会不同,能在简单归纳的同时完整存下来原始内容是最合适的。
    webshe11
        18
    webshe11  
       2021-08-24 14:12:55 +08:00
    @kebamt #14 archive.today 排队的话可能要一会,不排队的话一两分钟就存好了
    hjq632233317
        19
    hjq632233317  
       2021-08-24 15:34:17 +08:00
    印象笔记剪藏 +1
    D3EP
        20
    D3EP  
       2021-08-24 16:21:50 +08:00
    Pocket 付费
    lxxself
        21
    lxxself  
       2021-08-24 18:02:33 +08:00
    保存为 pdf 、发送内容到邮件、保存到 notion 等等
    Kaiyuan
        22
    Kaiyuan  
       2021-08-24 18:47:26 +08:00 via iPhone
    我现在用的是群晖 Note,完整剪藏。免强可用,主要是数据全在我自己手里踏实。然后群晖又有加密备份到云盘的功能。
    longtzw
        23
    longtzw  
       2021-08-24 18:54:36 +08:00 via iPhone
    Devonthink 保存为 Web Archive,完美
    xarthur
        24
    xarthur  
       2021-08-24 19:48:02 +08:00 via iPhone
    如果你用的是 macOS,可以试试 EagleFiler 。
    crab
        25
    crab  
       2021-08-24 20:29:45 +08:00
    保存本地比如 mhtml pdf 再云备份才是可靠的。
    ThirdFlame
        26
    ThirdFlame  
       2021-08-24 20:53:29 +08:00
    singlefile 保存成单 html
    zhanggong
        27
    zhanggong  
       2021-08-24 22:01:23 +08:00
    Renven1
        28
    Renven1  
       2021-08-24 22:15:50 +08:00
    这样是不是可以结合起来把 V 站每天最热榜给全部保留下来,错过那天就可以回看了~
    Salicylicacid
        29
    Salicylicacid  
       2021-08-24 22:19:01 +08:00 via Android
    强推 onenote
    Maskeney
        30
    Maskeney  
       2021-08-24 22:22:52 +08:00   ❤️ 2
    archive.today 系列,
    archive.today
    archive.is
    archive.ph
    archive.vn
    archive.fo
    archive.li
    archive.md

    目前墙内可直接访问的域名应该是只剩 archive.vn
    WildCat
        31
    WildCat  
       2021-08-24 22:54:56 +08:00 via iPhone
    如果你用 iOS/macOS 的话,可以考虑下我们做的
    https://www.twilar.com/

    未来会出一个简化的 web 版本
    zyxk
        32
    zyxk  
       2021-08-24 23:46:42 +08:00   ❤️ 1


    onenote chrome 插件
    xz
        33
    xz  
       2021-08-24 23:51:12 +08:00 via iPhone
    有的,我记得有两款,把链接发过去就会复制一份副本,手机电脑还有 web 都有客户端
    一个叫 pocket,还有一个好像是什么 page 免费的
    kebamt
        34
    kebamt  
    OP
       2021-08-25 06:38:16 +08:00 via iPhone   ❤️ 1
    @WildCat 试了一下,确实很优秀!不过非苹果设备全平台有些问题,iPadOS 就用这个了,期待网页版~
    LeoSUPERB
        35
    LeoSUPERB  
       2021-08-25 09:35:13 +08:00
    SiteSucker Pro
    lio444
        36
    lio444  
       2021-08-25 09:39:42 +08:00
    @kebamt 那就是你的使用方法不对,我正常使用
    kasusa
        37
    kasusa  
       2021-08-25 10:42:59 +08:00
    从信息收集的角度来说,别人的文章不一定是最好的。
    最好的办法就是自己提取出来信息之后,自己整理一下语音然后再发布出去。比如放到 github.io 或者自己的博客。永远不会丢。
    而且这样回头看的时候也更容易看懂。毕竟是自己写的。
    jy02201949
        38
    jy02201949  
       2021-08-25 10:59:06 +08:00
    hxys
        39
    hxys  
       2021-08-25 13:05:38 +08:00
    劝你别用 webarchive, 它会被 DMCA 管制
    可以弄一个 tg 群或者某些群组,或者匿名版之类的,再或者 onion
    docx
        40
    docx  
       2021-08-25 13:10:37 +08:00
    只要文章主体的,用笔记软件的剪藏

    要求网页完整性的,用 WebArchive 类工具

    注意,如果备份不是存储在自己手里,可能有再次被删的风险
    snowfuck
        41
    snowfuck  
       2021-08-25 13:26:35 +08:00
    可以看看这个 https://github.com/go-shiori/shiori
    可以自建本地服务
    xingyuc
        42
    xingyuc  
       2021-08-26 11:44:31 +08:00
    前段时间也遇到过,只能说中文互联网环境的体验很 sb
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1337 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 23:29 · PVG 07:29 · LAX 15:29 · JFK 18:29
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.