抓取某博主的全部博文,生成 mobi 或 epub 电子书。
好像没找到现成的。GitHub 上单纯抓取的倒找到几个,但好像都是纯文字的,图片都不管。
好像没找到现成的。GitHub 上单纯抓取的倒找到几个,但好像都是纯文字的,图片都不管。
1
takanasi Oct 5, 2017
你愿意出多少钱?
|
3
cynicalwalker Oct 5, 2017 via Android
我只知道有抓知乎内容的,不过已经弃坑了
|
4
isCyan Oct 5, 2017 via Android
关键词 新浪博客导出工具
|
6
Yvette Oct 5, 2017 via iPhone
帮人找过没找到,后来花了几块钱去淘宝做了份导出到 PDF,效果比想象好。
|
7
weakish OP @cynicalwalker 我去年写过抓知乎专栏的命令行工具(带图片,但不支持增量抓取) https://github.com/weakish/ceylon-zhihu 不知道现在还能不能用
|
9
SENSIR Oct 5, 2017 via Android @weakish @cynicalwalker
歪个楼,我最近刚好在弄知乎读读日报的抓取,可以抓个人首页流和热门文章流,自动制作 mobi 文件(.net core 程式),感兴趣可以看一下… https://github.com/ludoux/DuduSpider |
10
TigerK Oct 5, 2017
以前有一个博客备份工具,可以把新浪博客和百度空间的文章都下载下来,然后导出 html 文件的。
今年还继续更新呢,不过是要收费的,地址是 http://www.pt42.cn/blog_backup_index.htm |
11
Junyiz Jan 24, 2018
http://d.junyi.me/ 新浪博客导出工具,导出 html 文件
|
14
Junyiz Mar 21, 2018 @weakish 抓取某博主全部博文并生成 html 的命令行程序: https://www.npmjs.com/package/dature
|