前几天发的博客今天我想在谷歌上搜了一下,看被收录的情况如何。结果让我发现了一个克隆站
这克隆站做的太绝了,所有东西都克隆了(唯独网址是他自己的)
我博客是用 jekyll+github pages 搭建的,访问是个二级域名,估计是权重没有人家 .com 的高,就导致了谷歌搜索结果里他的排名在前
为了防止被爬虫网站爬博客内容还不留原文链接,我每篇博客里都会手动加上类似下面的原文链接
链接文原: https://tomoya92.github.io/2021/01/14/spring-cloud-bus/
没想到就连我写死的这个链接的域名也被换了。。


以前发现别人转载我博客如果没有留原文链接的话,我都会给人家发邮件联系一下,现在倒好,整个站都是克隆我的博客。真心过分了。
如果这个克隆站的站长也逛 v2,看到这个帖子后还请停止你的克隆行为(至少原文链接应该保留一下吧),写博客不容易,窃取别人的劳动成果不好玩,谢谢。
求问,碰到这种情况有什么好的解决办法吗?
感谢大家的评论
最后,克隆站的站长,如果你只是为了好玩,还请换位思考一下,尽快停止这种行为。如果是为了简历好看,建议不要做这种临阵磨枪的事,踏踏实实学好自己感兴趣的技术才是正道。如果是为了养你域名的权重,那我是真没办法,只能站在道德的角度在v2发篇帖子谴责一下你这种无耻的行为罢了。
|  |      1wamson      2021-01-15 09:15:02 +08:00 via iPhone 在博客里放的图打个水印,然后写上其他网站都是克隆的。 | 
|  |      2rap16      2021-01-15 09:17:26 +08:00 图片加水印 | 
|  |      4xratzh      2021-01-15 09:20:24 +08:00 都是自动爬虫的,文章里加上:本文链接 | 
|      6march1993      2021-01-15 09:24:07 +08:00 via iPhone 写个 js 判断域名自动跳转? | 
|      7FlyingShark      2021-01-15 09:25:13 +08:00 可能被反代了吧?用 js 来检测 | 
|      10tomoya92 OP @FlyingShark  #7 不可能是反代,我在这个帖子描述里放了两张图,那是我写在博客内容里的纯文本内容,这都被替换了,怎么可能是反代  | 
|  |      11rabbirbot00      2021-01-15 09:29:09 +08:00 看了下他是用 dnspod 解析的,尝试联系一下腾讯客服看看能不能停解析,源站没套 CF,IP 是这个 155.235.130.184 打或者联系商家随意吧 | 
|      12Mithril      2021-01-15 09:30:38 +08:00  5 给 Google 发 DMCA 这人是 DNSPod 买的域名,上去举报 或者你直接想办法买点 DDOS 直接炸穿它 | 
|  |      13PEIENYKYK      2021-01-15 09:30:47 +08:00  1 这 TM 。。。。太恶心了 | 
|  |      14maomaomao001      2021-01-15 09:31:39 +08:00 @原文链接再加个 短链接 (让他们没法自动自断替换 ) 试试 | 
|      15tomoya92 OP @rabbirbot00  #11 谢谢,我先在谷歌上举报一下吧,腾讯那尿性,10 个客服里 11 个都是机器人,指望不上 | 
|      16tomoya92 OP @maomaomao001  #14 这跟图片加水印一样,只能防君子,而且增加写博客的成本 | 
|  |      17alect      2021-01-15 09:34:49 +08:00  6 把你自己 GitHub page 套一层 CDN,然后把他的服务器 ip 屏蔽了。 可以参考这个文章,https://monkeywie.cn/2020/08/20/fast-github-page-with-cloudflare/ 然后 Cloudflare 直接屏蔽它整个 ASN 。 | 
|      18FlyingShark      2021-01-15 09:35:11 +08:00 @tomoya92 nginx 扩展可以替换响应内容 | 
|  |      20xiri      2021-01-15 09:36:19 +08:00 via Android  2 建议不要把放博客源文件的那个仓库公开访问(看了你的 github,是公开的)。 这么说吧,我现在完全可以克隆一下你那个仓库,然后改一下配置文件里的域名后重新生成,再复制一个你的博客🙃。 这种像素级的镜像首先考虑是不是被反代了,如果是静态博客的话则需要考虑我上面提到的是不是博客源文件泄露了,最后才是考虑爬虫。 | 
|  |      21zhangolve      2021-01-15 09:37:28 +08:00 所以克隆的那哥们到底图你啥。。。 | 
|  |      22KDr2      2021-01-15 09:39:33 +08:00  4 先发一篇指出并谴责他是克隆站的 post,看他跟进不。 | 
|  |      24totoro625      2021-01-15 09:42:21 +08:00 想开点,别人浪费一个 .com 域名帮你做博客 文章更多的是给人看到而不是以何种途径出现在网络上(强行安慰自己) 例如: https://www.v2ex.com/t/685624 看了一下是 github 里面下载的 md 文件修改了点主题,没有你的 disqus 和 不蒜子 ,但是他自己加了个 cnzz 统计 解决办法就是文件放私库,这样别人就下载不到你的 code 了 | 
|  |      25PEIENYKYK      2021-01-15 09:43:52 +08:00 插眼,自己的 blog 也有被 clone 的风险 | 
|      26lovestudykid      2021-01-15 09:44:25 +08:00  4 kknews 做那么大还活的好好的,举报有用? | 
|      27yhy666888      2021-01-15 09:46:41 +08:00 图片水印其实不错,不过我有见过因为原文有水印,搬运者就自己操作了一遍截图放上去 | 
|      28dddd1919      2021-01-15 09:47:26 +08:00 如果是爬虫+替换的话,可以针对自己文章声明的链接做点处理,防止被替换掉 1.把自己文章的 github.io 链接转成短链接,而且最好用多个短链接服务 2.链接加点分隔的随机文本转 base64 保存,然后用 js 动态反解 | 
|      30tomoya92 OP @KDr2  #22 说实话,我怕被倒打一耙,我发一篇谴责这个克隆站的博客,这个站长应该有两种选择 1. 无视,只转技术博客 2. 同样克隆,然后把黑的改成白的,再发出来,他网站权重比我要高,到时候说是我镜像他的网站,我就哭死也说不清了。 | 
|  |      311daydayde      2021-01-15 09:52:06 +08:00 2021-01-15 09:51  克隆站已无法访问 | 
|      32tomoya92 OP @dddd1919  #28 这种成本对我来说高了,细心的 v 友应该会发现去年有大半年没有更新博客了,就是因为图片麻烦,截个图,先要放在相应的文件夹里,然后还要手动写 md 语法引入图片。 年底的时候在 vscode 上找到了一个插件,直接截图在 vscode 里粘贴就可以了,这才继续更新博客了 所以加短链,图片加水印这种操作,我是宁愿关了博客也不会弄的。真心麻烦 | 
|      34tomoya92 OP @0312birdzhang  #31 我还可以访问 | 
|  |      35Tink PRO 这是反代吧? | 
|      39newtype0092      2021-01-15 10:00:26 +08:00  1 额。。。我看成有“碰到有赛博人克隆自己该怎么办”。。。。 | 
|  |      41gaogao321      2021-01-15 10:04:23 +08:00 @0312birdzhang 2021-01-15 10:03 克隆站仍然可以正常访问 | 
|  |      42odi      2021-01-15 10:10:12 +08:00 其实有点远了,写博客的目的,不就是传播么,,,还是就只为了一个博客网站。 那么除了技术上能做的,加链接,加各种链接,图片打码,,,文字也可以阿。文中多出现自己博客名字,不局限于同一种格式,尽量增加对方 替换的难度 ? | 
|  |      43cherryas      2021-01-15 10:15:44 +08:00 其实可以加点文字水印,只要这个网站不能盈利人家克隆你证明你的内容有价值。加点文字水印保证真的做起来是自己原创的。 | 
|  |      46zy445566      2021-01-15 10:18:20 +08:00 via Android 我的博客也被别人 fork 过,有利有弊。他既然要给你做宣传,你就写博客的时候多埋点,多在里面时不时贴不同的社交账号。那始终会把流量又重新引导到自己身上。 | 
|  |      48pockry      2021-01-15 10:21:59 +08:00 你再去开个公众号,往公众号导流,然后就变成了别人免费给你增粉,那不是获得免费流量? | 
|  |      49wangpao      2021-01-15 10:27:50 +08:00 哈哈哈哈,看成克隆人 | 
|      50vanityfairn      2021-01-15 10:36:56 +08:00 | 
|  |      51zfish      2021-01-15 10:37:26 +08:00  2 最好的解决办法是在页面的所有版本中使用 rel="canonical"链接元素,标明哪一个版本是最原始的版本。 当你和第三方联合发布内容时也会出现上述类似的情况,原因是搜索引擎可能会将文章的副本从搜索结果中过滤掉,转而使用文章被重新发布的版本,这一问题的三个解决方案如下: 1. 要求重新发布文章的负责人使用 rel="canonical"链接元素标签将内容链接回你网站的原始页面,这能够让搜索引擎知道你的页面才是最原始的,任何进入重新发布页面的链接都会被记入在原始页面中。 2. 让合作伙伴在内容副本中添加 noindex 标签,这会阻止复制版本进入搜索引擎索引,同时,该内容中任何链接回你网站的链接仍然还能够将链接权限传递给你。 3. 要求合作伙伴链接回你的网站的源页面,你这样做的话,搜索引擎通常都能正确理解这一做法并重点突出你内容版本。但需要注意的是,有些情况下,谷歌会将内容的原创性归于重新发布的网站,尤其是当重新发布的网站比内容实际的源网站权威性和信任度更高时。 --- 你可以使用各种在线工具轻松找到侵权者,包括 Plagium 和 Copyscape 。但如果他们把侵权者的权限包含在你的设计中,处理就会更加困难。有以下 5 个处理侵权的办法: 发送 DMCA (数字千年版权法案)侵权通知。 联系侵权公司的 CEO 、销售主管、法律顾问或任何人,或者任何你觉得最有可能回应的人。 如果不是自托管,通知该网站的托管公司。 报告你的博客活动,或者如果你的博客不受欢迎,用受欢迎的博客进行举报。 让你的律师发出侵权停止和终止函。 | 
|      52vanityfairn      2021-01-15 10:37:39 +08:00 | 
|  |      535408      2021-01-15 10:42:22 +08:00  4 emmmm...并不完全一样,你的有广告,克隆站没有[手动狗头] | 
|  |      54austfisher      2021-01-15 10:46:22 +08:00 名字都爬过去的话 岂不是你的博客分站 | 
|      55cndota      2021-01-15 10:47:10 +08:00 牛逼牛逼,想学学这个克隆网站怎么做到的 /doge | 
|      56tomoya92 OP @vanityfairn  #50 是这个域名被国内给墙了 github.io ,不是我博客的问题 | 
|      57tomoya92 OP @zfish  #51 rel="canonical" 一直都有,刚看了一下,克隆站把这个网址也换了   | 
|  |      58supermao      2021-01-15 10:57:06 +08:00 我也想知道是怎么做的克隆,看着样式都一样,看着是 md 内容,是整个 html 内容 copy 过去还是把 md 逆向之后存数据库,还是怎么个回事呢?纯好奇。 | 
|      59jfcdada      2021-01-15 10:57:38 +08:00 via Android 加个广告 让他帮你代宣传?? | 
|  |      60supermao      2021-01-15 10:57:59 +08:00 只是想不到就是说这样 copy 有啥意义 | 
|      61arvinsilm      2021-01-15 11:00:17 +08:00  4 来个杀敌一千自损不知道多少的办法 测一下克隆时间,掐时间点发点 FAN 动信息,等它克隆过去后,自己博客里的马上删掉。举报给狗日的腾讯,保证立马挂掉 | 
|      64ai277014717      2021-01-15 11:13:25 +08:00 之前尝试“破解”某站点时,调了一个未鉴权的接口直接把我 ip ban 了。。。可以参考下。在 js 里放点料。 | 
|      65sunny352787      2021-01-15 11:16:26 +08:00 看了一下请求,应该是做了反向代理 | 
|  |      66keepeye      2021-01-15 11:17:03 +08:00 被盯上的话,这个真的很难防的 | 
|  |      67zfish      2021-01-15 11:18:00 +08:00 @tomoya92 发送 DMCA (数字千年版权法案)侵权通知吧,具体流程我没操作过,但是 Google 对于克隆站是有一套专利去识别谁是源站的,如果它的排名比你高,那很可能占据了域名优势,老域名权重比你高,这种情况只能给 Google 或者主机厂商发 DMCA 了。 | 
|  |      68keepeye      2021-01-15 11:18:05 +08:00 你发一个文章声明那个站是抄袭,然后看对方会不会无脑采集这篇文章 | 
|  |      69lucybenz      2021-01-15 11:18:58 +08:00 对方应该是收集了各种教程  但是他只把你的这部分放到首页了,其它的都藏在分类目录里 http://www.lachuaica.com/category/    所以猜测 他应该是手动收集整理的 | 
|      70sunny352787      2021-01-15 11:19:37 +08:00 看这意思是拿你的 blog 刷这个域名的权重做 SEO,后续估计会修改指向做他自己要做的事 | 
|  |      71zfish      2021-01-15 11:19:44 +08:00 @tomoya92 还有一个笨办法,你可以在知乎或者其他大的平台上先发布内容,等一段时间再在博客上发布,然后知乎这类平台上把原文链接到你的博客上,这样可以指导搜索引擎发现谁是原作者,如果他敢在知乎上抄袭你内容,那直接给知乎举报就好了。一般一篇文章发布到知乎,很快就被收录了,这种大站权重很高。 | 
|  |      72SmallTeddy      2021-01-15 11:22:47 +08:00 文章整个用 image 渲染,然后 image 加上北京水印 | 
|      73tomoya92 OP @lucybenz  #69 不不,你把他这域名换成我博客域名,会发现也是一样的,这是我更新博客主题之前遗留的页面,我没把它展示出来,还有一个 /tag/ 现在也能访问 | 
|      75xiaorande      2021-01-15 11:29:26 +08:00  1 克隆绵羊没爹没娘 | 
|  |      76eason1874      2021-01-15 11:29:45 +08:00  2 @supermao #60 意义就是用博主的原创内容给自己的域名养权重,让搜索引擎认为这个域名的网站有稳定高质量更新,之后发自己的内容也会很快被收录而且有不错的排名,这是站群的玩法之一。有一些菠菜站群连 gov 网页都敢反代。 @tomoya92 静态站被采集被反代,很难反抗。 要是真的在意,你注册个便宜域名来绑定,稍微短一点的。全部图片都打上倾斜多行排列半透明的域名水印,反正技术图片,这样也不影响观看。分享的代码的类名和注释那些时不时写上一些特有名词,比如 tomoya92UserFilter 到谷歌站长平台提交你的域名和站点地图,连续几次发布了新文章第一时间去站长平台点抓取,应该很快就会有排名了。 | 
|  |      77cf020031308      2021-01-15 12:26:37 +08:00 我也遇到过别人直接 fork 的,除了觉得这有点没礼貌以外(我预想的是你发个邮件来拍一下马屁嘛),其实无所谓。 本来我写东西就是为了自己精进,也不搞公众号什么浪费时间的。 说到底,我觉得(就我写的那些)代码、笔记都算不得壁垒,谁爱用谁拿去用,不值得花精力纠结。 | 
|  |      78Kilerd      2021-01-15 12:43:16 +08:00 也挺好,证明你写的东西有人关注了。 | 
|  |      80ZhaoHongXuan      2021-01-15 13:02:56 +08:00 @tomoya92 求 vscode 插件啊。找好久这种插件了 | 
|      81tomoya92 OP @ZhaoHongXuan  #80 mushan.vscode-paste-image | 
|  |      83radiocontroller      2021-01-15 13:19:15 +08:00 看了前面的回复,已经把博客 repo 改成 private 了 | 
|      84tomoya92 OP @radiocontroller  #83 改成私有的之后,github pages 还能访问吗? | 
|  |      85yulgang      2021-01-15 13:24:38 +08:00 有点意思,蛤蛤蛤蛤  JS 判断一下域名,不是你的就跳回你的站,然后做一下混淆加密。 | 
|  |      86encro      2021-01-15 13:38:38 +08:00 人家网站速度比你快,还没广告。哈哈 我们一个商业网站,模仿的有几十家,有几家图都不换,品牌都没换。 | 
|      87iYY      2021-01-15 13:44:24 +08:00 这头像都不换啊 | 
|      88hsjylaji      2021-01-15 13:54:46 +08:00 我还以为你碰到克隆人了 | 
|  |      89abersheeran      2021-01-15 14:07:42 +08:00  1 看到你博客都是讲 Java Sprint 的,说句老实话,因为培训班的问题,Java 程序员群体几乎是中国平均素质最低的程序员群体……我 Python 也即将沦陷。 看看隔壁搞 Rust 的。有时候不禁感概,门槛高一点,世界真的会清净很多。 | 
|  |      90abersheeran      2021-01-15 14:08:17 +08:00 @abersheeran 手快打错字了。Spring | 
|      9177alex      2021-01-15 14:20:00 +08:00 弄点 zz 敏感信息,然后一波举报就行 | 
|      93bofei      2021-01-15 14:26:25 +08:00 碰到有人克隆自己怎么办? | 
|  |      95amiwrong123      2021-01-15 14:59:40 +08:00 | 
|  |      96tuwulin365      2021-01-15 15:18:08 +08:00 遇到克隆人怎么办? | 
|  |      97AsiaToyo      2021-01-15 15:21:04 +08:00 这种应应该是采集了,域名很好替换。建议图片添加水印。静态博客比较难生成不规则 class 。 | 
|      98ccreading      2021-01-15 15:42:59 +08:00 我是图片加的水印,用 1drv 的直链  http://www.blog.stdfirm.com/ | 
|  |      100radiocontroller      2021-01-15 15:49:08 +08:00 @tomoya92 我有自己的机子,所以不清楚 github pages 行不行 |