thinszx 最近的时间轴更新
thinszx

thinszx

V2EX 第 380520 号会员,加入于 2019-01-28 00:37:45 +08:00
根据 thinszx 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
thinszx 最近回复了
5 天前
回复了 Rv9H 创建的主题 求职 [求职] 合肥有没有 Linux 内核相关工作
联发科应该也可以,都在高新这边
5 天前
回复了 Rv9H 创建的主题 求职 [求职] 合肥有没有 Linux 内核相关工作
h3c 交换机部门应该会有这方面的需求,可以试试看
5 天前
回复了 YanSeven 创建的主题 程序员 关于大模型原理的感叹
@LaurelHarmon 我指的是最基本的先验后验的学习过程,理解和生成一个是学习分布一个主要是从学习后分布采样那肯定是不一样的,但我觉得不管是自监督强化学习最本质的贝叶斯出发的想法是不变的
5 天前
回复了 YanSeven 创建的主题 程序员 关于大模型原理的感叹
@YanSeven 我自己的理解是,从统计学的角度出发,深度学习模型拟合的是数据集的高维分布,我们可以假设不管模型大小,深度学习模型的权重都由很多个不同分布的低维高斯分布构成,同样地,我认为人类对于世界的拟合也可以看作很多个高斯分布的复杂组合,即不管是语言、图像还是什么模态,都可以看做是人类对世界的 embedding ,大模型之所以能涌现,是因为输入的人类对世界的 embedding 足够多,因此帮助了大模型将自己的输入输出空间对齐到了人类对世界的拟合维度,你可以认为是因为大模型真的认识到了世界,所以才会出现涌现的现象,当然语言只是对世界的片面描述,这也是为什么李飞飞等人转向了世界模型,用机器人在真实世界的强化学习过程来帮助大模型真的认识世界
6 天前
回复了 YanSeven 创建的主题 程序员 关于大模型原理的感叹
原理其实从 bert 甚至从 lstm 、一维 cnn 起就没变过,之后 chatgpt 是量变引起质变的验证,感兴趣可以看看一维 cnn 做时序预测相关的工作就知道了
9 天前
回复了 colincat 创建的主题 职场话题 各大互联网公司使用 AI 编程情况调查
某 to g ai 中厂,内部工具不好用,cursor 安装需要审批,不过我是这个领域的新人,所以强迫自己看看相关代码的底层实现还是挺好的
被当成 ab test 了哈哈...
11 天前
回复了 xuzhijian24 创建的主题 NAS 国内的 nas 会不会被监控
倒不至于吧,想想每天监视 nas 的话要存储的费用也是天价...
量化有两个方向,一个是做策略研究,一个是做量化开发,量化开发的话门槛低一点,可以找点 cpp 类别的开发,特别是分布式高性能相关的大厂实习,会有加分,至于策略研究,citadel 这种级别招的都是数理基础绝佳的人,楼主的学历说实话只够到了门槛,这种世界 top 的量化策略很多人是清北华五(可能华五都不太够)的数学物理专业成绩 top+国外应统类别研究生,门槛非常高,可以先去国内低级别的私募量化先做一段时间量化研究试试,国内浙人科出来的做量化的公司都不少
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2582 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms · UTC 03:03 · PVG 11:03 · LAX 19:03 · JFK 22:03
♥ Do have faith in what you're doing.