现在越来越多的内容被审核给和谐掉,或者某个网站域名更换无法找到了,有没有一种比较好的方案在尽量保证网页样式不变的情况下进行剪藏的方案呢?
或者说开发一个剪藏系统应该以一个什么样的思路呢?
1
cmdOptionKana 2022-11-15 19:35:07 +08:00 1
浏览器插件 SingleFile
|
2
hamsterbase 2022-11-15 20:37:46 +08:00 via iPhone 2
1. 用 singlefile 保存 html
2. safari 右键另存为 webarchive 3. chrome 右键另存为 mhtml 这三种格式都能完美的保存 css ,图片 ,html 。 hamsterbase 支持导入这三种格式的网页。 导入后支持以下功能 1. 完美渲染, 2. 支持在网页上批注做笔记。 3. 全文搜索 4. 根据条件筛选 5. 筛选后以 rss 输出 |
3
afutureus 2022-11-15 20:59:15 +08:00 via iPhone 2
保存为 pdf 。
之前试过 n 种办法,最后用 safari 的 导出为 pdf 解决了。导出的 pdf 是一个完整无分页的。 |
4
Garasu 2022-11-15 21:09:11 +08:00
群晖的 note 有个 chrome 的插件,能把网页收藏到 note 里,可以选择简化内容 完整内容 整个页面屏幕截图 屏幕截图 四种。
除了群晖的 note ,一些笔记软件也有这个功能。 |
5
DIO 2022-11-15 21:46:26 +08:00
我折腾过很多方案。SingleFile is best
某象笔记 做笔记的话 也不错,但是收费。 chrome 另存 pdf 保存不够完整。 另外还听说过 server 方案,把浏览的网页全部保存,有点心动,但是种种原因还是没尝试 |
6
crysislinux 2022-11-15 22:42:53 +08:00 via Android
要说方便的话还是得那些笔记软件出的浏览器插件。
|
7
hamsterbase 2022-11-15 23:14:53 +08:00
@DIO
试试看我? 1. 支持在 nas 上部署 https://hamsterbase.com/zh/docs/install/synology.html 2. 支持自动导入文件夹下的全部网页。 你之前 singlefile 保存的网页可以全部导入。https://hamsterbase.com/docs/importing-website.html#automatic-importing 3. 支持绑定 singlefile 插件,一键导入。https://hamsterbase.com/zh/docs/integrations/singlefile.html |
8
edis0n0 2022-11-15 23:17:05 +08:00
Ctrl+P 打印为 PDF ,虽然不能搜索不能复制但能保证不会引用外部内容,内容永远不会变
|
9
agagega 2022-11-15 23:23:52 +08:00 via iPhone
最完美的方案应该还是逐站进行优化(大部分内容其实都来自那几十个国内外知名网站,剩下的个人博客是很好直接从 html 抓的)。直接保存请求得到的 html 肯定不行,因为很多网站要用 ajax 做渲染,至少得保存渲染完之后的内容
|
10
hamsterbase 2022-11-16 00:46:03 +08:00
@agagega
如果不是批量爬虫,手动保存网页,那么 singilefile 、浏览器自带的快照会更合适一点。ctrl + s 就存下来了。 此时保存的是 ajax, 前端框架渲染后的页面。 只需要把当前的 css 、html 、图片 存下来。 基本上保存前怎么样,保存后就是怎么样。 甚至可以 翻译、去广告之后再保存。 如果要批量保存 url ,可以试试看 singlefile 自带的保存功能。 1. 安装 singilefile 2. 右键 -> singilefile -> Batch save URLS... |
11
TuringHero 2022-11-16 00:52:06 +08:00
Cubox 有快照
|
12
rpish 2022-11-16 00:54:59 +08:00
cubox/inoreader
|
13
WebKit 2022-11-16 01:06:12 +08:00 via Android
笔记插件,直接截图保存
|
14
efaun 2022-11-16 01:24:56 +08:00
Webrecorder
|
15
CSGO 2022-11-16 09:16:40 +08:00
@cmdOptionKana SingleFile 和 Save Page WE 有什么区别?两个我同事保存同一个大网页,一个 20mb ,一个 15mb 。
|
16
xiang0818 2022-11-16 09:34:49 +08:00
有道云笔记插件了解一下
|
17
cmdOptionKana 2022-11-16 09:39:00 +08:00
@CSGO 没用过 Save Page WE, 看起来也很不错
|
18
Jacobson 2022-11-16 10:56:04 +08:00
save as mht
|
19
lxxself 2022-11-17 10:24:33 +08:00
@hamsterbase 有点东西,试了试,功能满足。不过 hamsterbase 前端交互一般般,搜索部分也搜不到。不过确实还不错了,打算试一段时间
|
20
hamsterbase 2022-11-17 12:12:43 +08:00 via iPhone
|
21
hamsterbase 2022-11-17 12:13:20 +08:00 via iPhone
|
22
lxxself 2022-11-17 19:34:04 +08:00
@hamsterbase 卧槽,没细看昵称,原来就是官方啊。有官方群聊么
|
23
hamsterbase 2022-11-17 20:47:54 +08:00 via iPhone
|