1
cruzzz 239 天前
IP 限制、点击限制、次数限制,这些和防爬一点关系也没有。我一个 wordpress 小白都听不下去了。
感觉这个话题太大了,以我在 v2 摸鱼这么多年的经验来看,最后一般是:无解~ 没有爬不到的网页。 |
2
passive 239 天前 via Android
关闭字体缓存,随机字体编码。但是也隔绝了搜索引擎的爬虫。
|
3
cJ8SxGOWRH0LSelC 239 天前 1
反爬都是以牺牲用户体验为代价的, 例如淘宝, 淘宝网页版反爬,把用户都弄的跑光了, 没一个人会说淘宝的体验好。
我觉得只要没有影响到服务器运行, 不要用什么反爬策略,最多也就是限制一下极端的请求频率即可。 |
4
devswork 239 天前
没有绝对的反爬,OCR 怎么解?
|
5
fyq 239 天前
技术上讲,只要能显示出来的东西,都能被爬到。经济上说,看哪一方谁更愿意投入成本而已。
|
6
fuzzsh 239 天前 via Android
用 css 画不用字体,干下 50%爬虫
|
7
kernelpanic 239 天前
瑞数
|
8
HUZHUANGZHUANG 239 天前
cloudflare 的那个进站验证是不是人那个功能,不知道可以不可以
|
9
baobao1270 239 天前
上 Cloudflare ,开 Bot Fight Mode
|
10
happydayandnight OP @baobao1270 开了 Bot Fight Mode 的
|