V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  menc  ›  全部回复第 30 页 / 共 47 页
回复总数  933
1 ... 26  27  28  29  30  31  32  33  34  35 ... 47  
2016-07-12 00:06:45 +08:00
回复了 dhlsnow 创建的主题 精灵宝可梦 为什么这么多人想着要去抓皮卡丘
抓到妙蛙种子、小火龙和杰尼龟的,可能会很强大。
但是抓到皮卡丘的,才是主角。
2016-07-11 19:53:54 +08:00
回复了 ChristopherWu 创建的主题 求职 多次失败后真诚求内推-FLAG, Twitter, Uber,Apple, Yahoo 等
@ChristopherWu

1. 大公司的实习经历
2. 和职位匹配而且不水的团队项目,学校的一年两年的小项目就算挺水的一个小项目。
3. 非常有名的个人项目
4. 有用的获奖经历, acm 奖牌, cf tc 乃至 kaggle 等等,还有微软 imagine cup 全国总决赛的名次,蓝桥杯和外包项目大赛这种是不能算得
2016-07-11 11:58:25 +08:00
回复了 ChristopherWu 创建的主题 求职 多次失败后真诚求内推-FLAG, Twitter, Uber,Apple, Yahoo 等
说实话,学历、项目经历、能力
真的都不出彩。
GSOC 算一个好经历, GSOC 的 manager 说了任何 gosc 的学生都可以找他内推,你可以试试。
不过讲道理,不看好。 Wine 这种项目在 GSOC 里面基本都是修修补补的工作,并不核心,所以可能也容易被人看轻。
2016-07-11 11:39:23 +08:00
回复了 shipinyun2016 创建的主题 云计算 网易视频云:百度网盘背后的存储系统 atlas
为什么网易宣传自己的数据存储服务,图片存在新浪的图床?
2016-07-11 11:38:52 +08:00
回复了 shipinyun2016 创建的主题 云计算 网易视频云:百度网盘背后的存储系统 atlas
为什么百度网盘用了网易的存储服务?
2016-07-11 11:37:59 +08:00
回复了 zzzzzy 创建的主题 程序员 发起个讨论,你们公司有 code review 吗?
one on one ,用 gerrit 来做 review 。

说不 review 的,都是没 review 过的, review 一下就知道了,注释, coding style 还有 bug ,问题茫茫多。

代码不仅是写给自己看的,在公司里也是写给别人看的, review 不止有挑 bug ,也有保证自己代码别人能读懂的关系在。 code review 不仅会找出 bug ,也会要求修改格式,添加注释以增加代码可读性。

在 V2 上看到有人推崇不写注释,要求代码自解释,来一个稍微大点的团队就知道,这根本就是狗屎。
2016-07-10 14:49:18 +08:00
回复了 chengfu 创建的主题 程序员 关于声形码的思考
@kamikat QR Code 是国际二维码的事实标准,国内国外都一样,你的问题应该是为什么国外就没流行二维码,而不是 QR Code 吧。

没去过,不了解。。
2016-07-10 12:54:52 +08:00
回复了 razrlele 创建的主题 生活 租房期间房东说要打隔断,能有啥办法不?
拿合同说事,合同上说了几室几厅的
2016-07-10 12:10:48 +08:00
回复了 chengfu 创建的主题 程序员 关于声形码的思考
@chengfu
再插一点和通信和信息论无关的。
你是产品经理,有这个 idea 相信做过调研,所有两个维度上展示信息的条形码都是二维码,你这个也是二维码的一种。我们现在最常见的叫 QR code ,仅仅是万千二维码的一种而已。
事实上除了 QR CODE ,形形色色的二维码都有,但是,他们都消失于历史的长河中,只有 QR code 活下来了。你可以想想为什么。
再看看 QR Code 的设计,就知道二维码其实门道很多。
2016-07-10 12:08:28 +08:00
回复了 chengfu 创建的主题 程序员 关于声形码的思考
@chengfu
我明白你的需求
我也看懂了其他人的回答
我也看出来你似乎觉得他们并没有明白你的需求
我也看出来你似乎觉得没人理解你的需求
我想了想,明白了可能他们说的太艰深晦涩,以至于没学过通信原理和信息论的人听不懂。
--
他们的话形象点来说,就是,你这个 idea ,和永动机一样,是违背自然规律的。你的如此少信息量的二维码不能够承载哪怕是极限取样和压缩后的声音。
2016-07-07 14:47:30 +08:00
回复了 awolfly9 创建的主题 C 程序员要不要为了面试刷很多面试题
@ma125125t 只有校招才问做项目用不到的东西,工作后跳槽问的都是工作相关的代码和工作经历
2016-07-06 11:33:29 +08:00
回复了 maskerTUI 创建的主题 PHP php 代码审计怎么学?
@SlipStupig
当年 seay 博客还和我互换友链,他安全水平也许可以,代码水平确实只能说不专业。
2016-07-06 11:28:55 +08:00
回复了 nimdanoob 创建的主题 数据库 python web 如何设计 酒店的 房态属性?
定时操作,数据库存的是数据,应当是正确的。
2016-07-06 11:27:17 +08:00
回复了 maskerTUI 创建的主题 PHP php 代码审计怎么学?
@al0ne 先学好开发,另外 seay 的那本书写的挺一般的,没有水平。
2016-07-05 13:55:37 +08:00
回复了 ipchy 创建的主题 程序员 个人博客有必要站库分离么?
@AscenZ gitpage 真的慢,所有文件放 cdn ,结果被首页一个文件拖下来了
2016-07-04 18:06:05 +08:00
回复了 jrhu05 创建的主题 问与答 什么样的网络公司名称才够高大上?
跟他们说叫赛博天下网络科技有限公司
英文名叫 saber
就好了嘛
就你在帖子中说的词频高低,频率不能离开逆文档频率,搜索 tf idf 查看文本赋权,然而用现成的 word embedding 结果应该会更好。
word embedding 的结果可以找现成的 model 。
@mayokaze 短文本用 LDA 并不好用,尤其对于微博这种口语化的新词众多的文本来说。

劝楼主,
recommending system 就按照 recommending system 的套路来搞,好好学习机器学习,@mayokaze 提的至少是一个上道的建议,帖子里面其他人的土方法大多数不值得一试。

几个点:
1. 构建用户向量,所有的用户都抽象成向量
2. 协同过滤是推荐系统的常用方法
3. 想办法使用合适的主题模型, LDA 对于短文本显然还是不太够用,如果有主题了可以拿来做用户聚类
4. 尝试各种算法来衡量向量的相似度,包括 pmi ,包括 pearson 系数,包括各种距离公式, cosine distance 或者 hamming distance 等等
5. 现有分词足够使用了, n gram 对算力的要求成倍增加,显然不是个好方案。
2016-07-03 22:59:29 +08:00
回复了 SlipStupig 创建的主题 Python 关于 python 性能加速问题的一些想法
浮点运算
和指令执行
要区分开
2016-06-30 13:33:39 +08:00
回复了 menc 创建的主题 分享发现 有道云笔记支持 MarkDown 了
/move/to 程序员
1 ... 26  27  28  29  30  31  32  33  34  35 ... 47  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1628 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 35ms · UTC 16:51 · PVG 00:51 · LAX 09:51 · JFK 12:51
Developed with CodeLauncher
♥ Do have faith in what you're doing.