V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  wangleineo  ›  全部回复第 28 页 / 共 39 页
回复总数  771
1 ... 24  25  26  27  28  29  30  31  32  33 ... 39  
2016-08-29 14:31:54 +08:00
回复了 Ricky123 创建的主题 机器学习 机器学习优质全文 RSS 收集
赞!
2016-08-08 13:11:20 +08:00
回复了 warlock 创建的主题 音乐 适合妹子,容易学的乐器有哪些
三角铁 沙锤 口哨
2016-07-28 13:46:21 +08:00
回复了 wangleineo 创建的主题 硬件 求推荐一款开发用 Windows 笔记本?
@chintj
@plqws
@clijiac
@20015jjw

XPS12 的平板笔记本和 surface Pro 比起来如何? Surface 价格略贵,有什么优势吗?
2016-07-26 22:11:05 +08:00
回复了 Mac 创建的主题 问与答 谁推荐点综艺节目或者电视剧
奇葩说 你会回来谢我的
2016-05-12 16:04:32 +08:00
回复了 wangleineo 创建的主题 分享创造 Leetcode 通关留念
@smallsix 你是?给点提示
2016-04-09 13:04:17 +08:00
回复了 wangleineo 创建的主题 问与答 怎样爬取微信公众号中的文章?
@matsuijurina 一个微信可关注的公众号数量是有限的吧,要关注所有公众号,不是要很多个微信号和很多设备?
安卓有没有类似方案?
2016-04-09 12:53:52 +08:00
回复了 wangleineo 创建的主题 问与答 怎样爬取微信公众号中的文章?
@2232588429 有的,看排行榜 http://werank.cn/
2016-03-14 22:30:10 +08:00
回复了 sa2852 创建的主题 Uber uber 这是想干什么 ?
恭喜入选 Uber A/B 测试用户,也许他们在用你来估算推送导致卸载的临界值。
2016-02-22 16:05:31 +08:00
回复了 wangleineo 创建的主题 问与答 怎样设计一个分布式的爬虫服务?
@Kirscheis
@knightdf
scrapinghub 就是这么做的: https://github.com/scrapinghub/frontera
这个组件的功能就是根据一些策略给 worker 分配爬取任务, worker 爬到新的 url 再提交给 frontera.
2016-02-22 13:02:50 +08:00
回复了 wangleineo 创建的主题 问与答 怎样设计一个分布式的爬虫服务?
@knightdf 那 bloomfilter 是做什么的?看一个 url 有没有被爬过?
2016-02-22 13:00:12 +08:00
回复了 wangleineo 创建的主题 问与答 怎样设计一个分布式的爬虫服务?
@gouwudang IT 桔子上没看到你们融资啊,是已经闷声发大财了吗?

@yangqi 这样的话, scraper 需要访问所有链接了,还是很容易被禁。 worker 只是分担了抓取动作本身。
1 ... 24  25  26  27  28  29  30  31  32  33 ... 39  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5726 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 46ms · UTC 02:04 · PVG 10:04 · LAX 19:04 · JFK 22:04
Developed with CodeLauncher
♥ Do have faith in what you're doing.