V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  gzdaijie  ›  全部回复第 5 页 / 共 7 页
回复总数  133
1  2  3  4  5  6  7  
2019-06-30 19:44:43 +08:00
回复了 gzdaijie 创建的主题 程序员 独立博客被各种聚合网站爬,好心累。
@skiy #121 你说的应该是 sitemap 吧,我现在发了后,第一时间到 Google Search Console 刷新,有一次十分钟就被爬了,冒了点冷汗。
2019-06-30 19:42:41 +08:00
回复了 gzdaijie 创建的主题 程序员 独立博客被各种聚合网站爬,好心累。
@LZSZ #118 我注册了,杭州的一家公司提供的服务,不过用不用再考察下,因为被爬对利益倒是没啥损失,主要是心累。推荐给全职写文的童鞋试一试~
2019-06-30 19:40:36 +08:00
回复了 gzdaijie 创建的主题 程序员 独立博客被各种聚合网站爬,好心累。
@exceloo #116 感谢你的认可~ 暂时就不分心了。先琢磨着怎么把原创内容搞起来,让谷歌对我友好一点。
2019-06-30 19:38:49 +08:00
回复了 gzdaijie 创建的主题 程序员 独立博客被各种聚合网站爬,好心累。
@JamesMackerel #111 允许翻译的内容,怎么翻译都是不侵权的。主要是机翻的内容,还被各种采集,就蛋疼了。真正好好翻译的内容,估计就沉了。机翻数量大,也成体系。
2019-06-30 19:37:11 +08:00
回复了 gzdaijie 创建的主题 程序员 独立博客被各种聚合网站爬,好心累。
@RiESA #114 哈哈,心疼请求数钱,估计你的图片和视频比较多,我的基本是文字,对象存储,一个月还花不了几个 G。
2019-06-30 19:35:00 +08:00
回复了 gzdaijie 创建的主题 程序员 独立博客被各种聚合网站爬,好心累。
@rudyyuan #120 觉得爬不好针对的是采集的人,留自己的博客是给觉得文章有用的人看,我觉得没什么矛盾的。

谴责、沟通、举报,我没有说半个怕字,我说的是我维权的经历和效果,大家觉得对自己建站有用,那就可以用。而且大部分评论都分享了很多自己的方法。这个帖子收藏量是评论量的 5 倍左右,大部分博主是有共鸣的。
2019-06-30 19:22:02 +08:00
回复了 gzdaijie 创建的主题 程序员 独立博客被各种聚合网站爬,好心累。
@jorneyr #119 我说了,我写了两年了,之前被爬走几十篇全删了,这个月又才写了几篇。大家探讨,可以少走弯路。比如反爬,水印,sitemap,spam report,全文爬的头条平台,等等。两年前知道这些,也不至于现在才从头开始摸索。我分享了我的经历,大家能够从中看到自己能用上的方法,目的就达到了。
2019-06-30 10:25:27 +08:00
回复了 gzdaijie 创建的主题 程序员 独立博客被各种聚合网站爬,好心累。
@mfu #105 我觉得你的博客也蛮有意思的~ 我觉得只要是原创的,肯定能吸引兴趣相似的人来看,至少真实呀,背后是一个真实在思考问题,在做总结的人。
2019-06-30 10:22:45 +08:00
回复了 gzdaijie 创建的主题 程序员 独立博客被各种聚合网站爬,好心累。
@RadishWind #106 其实满建议用 github 的 pages 的,issue 搜索不够友好,然后展示也受限。随便找个 静态框架,markdown 扔进去,一把生成了往主干一推了事~
2019-06-30 08:58:16 +08:00
回复了 gzdaijie 创建的主题 程序员 独立博客被各种聚合网站爬,好心累。
@GTim #99 哈哈,我原来也不写心得,现在也开始写感悟了,博客折腾记。有时觉得比技术文章更有价值,总结后自己也学到了不少。
2019-06-30 08:56:12 +08:00
回复了 gzdaijie 创建的主题 程序员 独立博客被各种聚合网站爬,好心累。
@1981 #102 我的浏览器也是 75.0.3770.100 (正式版本)( 64 位),估计是网络问题,有东西没加载完,你可以微信扫一扫,在微信里试一试?微信里能评论,长按二维码能打赏。兼容性的问题,当时考虑了 IE11, Chrome,Safari 和 Firefox。
2019-06-29 22:48:57 +08:00
回复了 gzdaijie 创建的主题 程序员 独立博客被各种聚合网站爬,好心累。
@qsbaq #95 交换友链的话,你可以到 https://geektutu.com/post/link.html 这里留言~
欢迎原创博主换链接。
2019-06-29 20:30:21 +08:00
回复了 gzdaijie 创建的主题 程序员 独立博客被各种聚合网站爬,好心累。
@hoyixi #87 非常感谢你的建议,目前还想在博客上做一些实验的,比如某些页面做些好玩的东西,公众号有点封闭了,再坚持坚持。
2019-06-29 20:17:32 +08:00
回复了 gzdaijie 创建的主题 程序员 独立博客被各种聚合网站爬,好心累。
@StarRED #83 写博客公开出来也是免费的,我觉得和免费不免费没有关系。只是希望原创者不要被误解为抄袭者罢了。
2019-06-29 20:15:50 +08:00
回复了 gzdaijie 创建的主题 程序员 独立博客被各种聚合网站爬,好心累。
@hoyixi #81 倒也不是为了赚钱,花费的精力也远远大于饮料钱,主要是做个总结,希望能帮到别人。但是不希望被无底线地爬取,最终原创的人被贴上抄袭的标签。
2019-06-29 20:13:38 +08:00
回复了 gzdaijie 创建的主题 程序员 独立博客被各种聚合网站爬,好心累。
@sbmzhcn #80 提交到百度=没有提交,一年来爬一次,爬的时候发现转载的早已被收录,降权重,改成两年爬一次。被收录的永远是转载的 CSDN,cnblogs 等少数几个平台,举报无用,恶性循环。
提交到谷歌=五分钟内收录,发现有人采集,可以举报,举报有用,还能搜到原创的东西。

所以现在专心在谷歌上优化了,百度彻底放弃了,提交了网址,几个月都不理一次的。
2019-06-29 19:03:45 +08:00
回复了 gzdaijie 创建的主题 程序员 独立博客被各种聚合网站爬,好心累。
@meetocean #78 你是专业写作的,这个评价很开心!技术博客写作算是业余爱好,不喜欢被采集也只是一时气愤不过。看了你写书的帖子,才觉得,版权状况的好转对于全职投入的人至关重要,祝愿你实现梦想!
2019-06-29 17:20:58 +08:00
回复了 gzdaijie 创建的主题 程序员 独立博客被各种聚合网站爬,好心累。
@haozi3156666 #70 我分析了大部分转载的网站,结果很失望。

1. 将指向原站的链接全部干掉。
2. 将原站链接的 a 标签,加上 nofollow, noindex 属性,搜索引擎会过滤掉有这个属性的标签。
3. 将原站的链接全转为跳转,比如 https://la_ji_zhan 点 com/go?href=你的链接,由垃圾站的服务器提供 302 重定向。
4. 把你原站的链接,全爬过来,都改为指向自己的。

最终连外链都舍不得施舍。
2019-06-29 17:02:48 +08:00
回复了 gzdaijie 创建的主题 程序员 独立博客被各种聚合网站爬,好心累。
@westoy #60 也有可能爬 sitemap,比对是否有新链接再过滤。估计维护了一个域名列表,定期去看是否有新链接。我被爬取后的文章不是 feed 里的原文,而是从 article 标签内部,过滤掉 a、script、canvas 等标签的结果。
2019-06-29 16:51:42 +08:00
回复了 gzdaijie 创建的主题 程序员 独立博客被各种聚合网站爬,好心累。
@littleghosty #66 爬 cnblogs 就太傻了,除非是做推荐用,比如 tuicool,cnblogs 的权重太高了。爬百度不管的原创博主,是收益最大的。
1  2  3  4  5  6  7  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3453 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 19ms · UTC 10:51 · PVG 18:51 · LAX 03:51 · JFK 06:51
Developed with CodeLauncher
♥ Do have faith in what you're doing.