V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Xs0ul  ›  全部回复第 17 页 / 共 38 页
回复总数  745
1 ... 13  14  15  16  17  18  19  20  21  22 ... 38  
2017-09-05 03:53:35 +08:00
回复了 jlsk 创建的主题 问与答 新听到一个超难算法题,大家来集思广益
@jedihy #11 能进一步解释一下极坐标的做法不?
2017-08-31 17:28:04 +08:00
回复了 Libby520 创建的主题 杭州 我在杭州呆了 8 年,有三个街头小吃念念不忘
梅干菜饼大爱
@northisland 94 楼的回复确实不对,感谢指出,我把你的 600+误认为 600 正面了,回头看了眼代码明白了。

关于我提到的 CRF as RNN,我说的频率和贝叶斯的区别,和 discriminative 与 generative 无关,表达的是深度学习并不是只有概率学派。

当然贝叶斯确实不比频率高明,因为在一些合适的假设下结果都是 0.6,频率的方法还更简洁一些。但是要解释怎么从 0.5 变成 0.6 的,确实是需要贝叶斯来解释的。

和你交流挺有收获,感谢
@northisland 另外单纯因为 2.53e-10 值小而否定结论可是不符合逻辑的。0.5 抛出 500/500 的概率照样是个超小的数。假设检验的问题,是另一个话题了。
@northisland 1. 不要用 machine learning 的分类来分概率论的东西吧?这不等于有人在讨论说养猫好还是养狗好,你说别争了都是活的
2. 我学的英文教材照样会提频率学派和贝叶斯学派的问题
3. 深度学习也不就是概率学派,就你说的 CRF,搜搜看 CRF as RNN 吧,在 semantic segmentation 上可是有很好的结果的。
看了这么多回复,看的有点尴尬,我来写一段,希望能粗浅地解释一下频率学派和贝叶斯学派。

这两个学派的核心区别在于,是否认为概率是一个确定的数值。频率学派的一个说法大家可能都听过,类似于概率是频率的极限,在这里就是扔硬币扔的足够多,概率很接近频率了,也就是 0.6。

更高级一点的方法有极大似然法,就是设这个确定的扔正面的概率是θ,那扔出 600 正 400 反的概率就是θ^600 * (1-θ)^400。极大似然法希望求出一个θ,使得发生这样 600 正 400 反的概率最大。标准做法就是取对数以后求导,过程不详细写了,结论依然是 0.6。

值得注意的是,以上过程完全不存在也不涉及“硬币正反面的概率各 0.5 ”这个假设或者前提。频率学派没法说,我按常理认为是 0.5,但是做了实验又觉得是 0.6 了,因为频率学派认为概率是一个完全确定的数值,定了 0.5 就改不了了。只有按照实验结果,得到是 0.6。

因此就有了贝叶斯学派。贝叶斯学派认为,正面的概率本身不必是一个定值,也可以是一个分布。比如说,虽然正常的硬币是 0.5,但这个硬币是张三给我的,这家伙就喜欢恶作剧,我估计了一下,这个硬币有 50%的可能是普通硬币,也有 50%可能是个 0.6 的硬币。这称为先验分布,给出了一个具有不同可能性的假设。之前有人说先验概率是多少多少,其实是没有意义的。

具体到计算,400 和 600 有点大算起来不方便,我就用扔一次和两次举个例子。假如第一次扔了正面,这个正面来自普通硬币的概率是 0.5*0.5,来自恶作剧硬币的概率是 0.5*0.6。很明显,直观看来,它更有可能是一个恶作剧硬币。具体计算,此时的概率分别是 0.25:0.3≈0.45:0.55 ,和我们直观相符。注意,此时结果仍然是一个分布,称为后验分布。

假如我们再扔一次,扔出了反面,结果就变成了一正一反,直观来看,这样更可能是普通硬币了。计算上,概率分别是(0.5*0.5)*0.5:(0.5*0.6)*0.4≈0.51:0.49 。确实是更有可能是个普通硬币。

之前提到,0.51:0.49 仍然是个分布,而不是具体给出了概率。还是依据直观,要给出一个概率的数值,可以选可能性最大的 0.51 对应的 0.5,这叫做最大后验概率。也还有其他选取数值的方法,不详细写了。

所以,贝叶斯学派的结果,既依赖实验,也依赖先验的假设。按之前的假设,即使 1000 次中次次正面,我也只能说 0.6 和 0.5 比,0.6 更有可能,而不可能得出是 1。假如我的假设是正面概率是 0-1 的均匀分布,600 正 400 负的结果恰好就是 0.6,这也和直观相符,因为均匀分布基本相当于没有提供信息。

有手滑打错的欢迎指出。希望有所帮助(
@t6attack #52 记住公式和记住概念是两码事,至少是知道有这样一个理论的存在。拿你的等比数列举例,你给没学过的人,他只能一个一个去加。但是学过的人,至少十几年内得知道有一个等比数列求和的公式存在吧?
@Taojun0714 #49 还有起手就是一个先验概率是多少多少,而不是先验分布
关键词:贝叶斯概率学派
2017-08-24 21:49:08 +08:00
回复了 imeilige 创建的主题 问与答 怎么删除 QQ 的赞记录,别人赞我的
说出你的故事
@imn1 #23 拿已知定义匹配倒是和我想到一块儿去了,用卷积就行(
我想的居然是卷积,怕不是学傻了(
没有神圣的 f2 连接我们玩不来了
2017-08-15 05:21:51 +08:00
回复了 wangleineo 创建的主题 程序员 个人学深度学习买哪一款 GPU 性价比最高?
@gladuo #74 很明显楼主说的学习你和说的学习完全不是同一个意思,看楼主后来的回复,应该是 Keras 文档里的十几行代码都没有试着跑过。

@wangleineo #73 https://keras.io/getting-started/sequential-model-guide/ 装好 Keras,再试试跑里面的代码。我笔记本的 CPU,跑 vgg-like 的例子,一个 epoch 也只要 3、4 秒。建议等你看懂了至少一个例子里每一行代码都在做什么,再考虑买 GPU 吧。
2017-08-14 02:32:02 +08:00
回复了 wangleineo 创建的主题 程序员 个人学深度学习买哪一款 GPU 性价比最高?
真要学,先老老实实去下官网 tensorflow、pytorch 的入门教程。那些 MNIST 的,CPU 足够入门原理了。等把 MNIST 的教程看懂学会,能自己修改个模型结构了,再去考虑买 GPU 也不迟。
2017-08-11 05:39:03 +08:00
回复了 MagaFun 创建的主题 问与答 怎样让 Visual Studio 的 Python 组件走代理?
我用 Proxifier 不知道添加什么规则的时候,一般是先改成全局,看看什么程序走了代理,再给对应的进程名加规则。

蒙一下是要给 python 加代理(
1. 按我学的交叉熵一般以 2 为底,这个习惯来自信息论的信息熵的意义

2. 作为 loss,用 e 还是用 2 本质上没有区别,只是 loss 差一个常数倍

3. 我猜楼主想到了 2,但是疑惑在于在那一步求导里,只有其中一项会因为换个底数多一个常数倍,另一项没有。实际上再往上翻,推 log(1 - h) 的时候,已经当作 e 为底,yi xi 消失的常数系数在这里漏掉了。

4. 推公式方便来说还是以 e 为底吧,不然不小心就会疏忽掉系数。
2017-08-02 10:15:23 +08:00
回复了 rebeccaMyKid 创建的主题 问与答 [ Python ] urllib.response 模块的文档竟然找不到??
@Xs0ul #3 *第二句里的链接
2017-08-02 10:14:49 +08:00
回复了 rebeccaMyKid 创建的主题 问与答 [ Python ] urllib.response 模块的文档竟然找不到??
type(request.urlopen('url'))会告诉你,f 属于 <class 'http.client.HTTPResponse'>

然后 https://docs.python.org/3/library/http.client.html 这儿告诉你 HTTPResponse.getheaders()是个啥

第二个链接可以直接搜 getheaders python 搜到(
2017-07-26 06:55:18 +08:00
回复了 Kung815 创建的主题 Python 计算这个 1 到 100 之和的代码为什么会出错?
先运行前两行(循环和加)外加一个空行,然后再 print
另外 number 是什么鬼(
1 ... 13  14  15  16  17  18  19  20  21  22 ... 38  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5326 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 30ms · UTC 03:37 · PVG 11:37 · LAX 19:37 · JFK 22:37
Developed with CodeLauncher
♥ Do have faith in what you're doing.