$V2EX
Solana
Give SOL to Copy Address
使用 SOL 向 sillydaddy 打赏,数额会 100% 进入 sillydaddy 的钱包。
 sillydaddy 最近的时间轴更新
sillydaddy
5.49D
4.37D

sillydaddy

V2EX 第 472822 号会员,加入于 2020-02-27 19:30:20 +08:00
今日活跃度排名 20
MOD
具有移动主题的权限
Scaling Law 真的很有意思!它停止了吗?
分享发现  •  sillydaddy  •  35 分钟前  •  最后回复来自 sillydaddy
7
对 HodlAI 的可持续性的质疑
HodlAI  •  sillydaddy  •  2 月 3 日  •  最后回复来自 workbest
24
ARC-AGI 测试这帮人疯了!
  •  1   
    分享发现  •  sillydaddy  •  1 月 29 日  •  最后回复来自 LiuJiang
    3
    vibe coding 的最佳实践到底是什么?
    Joe's Talk 🪐  •  sillydaddy  •  1 月 23 日  •  最后回复来自 goodboy95
    28
    编程已死!
  •  1   
    职场话题  •  sillydaddy  •  2025 年 12 月 31 日  •  最后回复来自 Livid
    63
    让你们的 AI 做做这道题,见真章!
    OpenAI  •  sillydaddy  •  2025 年 12 月 27 日  •  最后回复来自 itechify
    5
    不知不觉 AI 可以算乘法了
    分享发现  •  sillydaddy  •  2025 年 12 月 24 日  •  最后回复来自 sillydaddy
    5
    sillydaddy 最近回复了
    35 分钟前
    回复了 sillydaddy 创建的主题 分享发现 Scaling Law 真的很有意思!它停止了吗?
    @iloveoovx
    你这逻辑跳跃的,确实该补点逻辑,而不是脑补什么「一听到 RL 缩放还能持续 1 年,就发生误会,损伤了股价」,你后面不也说了学术界有层出不穷的优化思路吗?

    另外,现实不就是 RL 缩放主导了缩放定律吗,主题里也提到了,缩放的方式改变了。怎么在你这里就成了置信度很低的单维度指标。

    关于 AI 公司的责任,考虑到我没有给你足够的上下文,我来补充一下,以免你产生幻觉。

    首先这个责任这不是我强加给它们的,所有 AI 公司都在说公共责任,特别是 Anthropic 。你可以看看他们出席多少公共论坛、接受多少公共采访,畅谈他们对 AI 的发展判断,去看看阿莫代伊的博客,里面「仁慈的机器」都出来了。

    然后你知道什么是 AI 发展中最重要的吗,不是别的,恰恰是 Scaling Law ,没有之一。谈 AI 发展的前提,就是谈缩放定律,而我说的 RL 缩放的时效,恰恰包含在里面,它还是一个核心。

    考虑到上面的 2 点上下文,你再去分析一下他们公开的发言,通篇都是多少年实现 AGI ,对未来的影响,但这些务实的缩放定律时效,他们丝毫不涉及!这个时效,是一个客观的东西,不是你说的用户满意度,它受限于客观的算力。你觉得,他们在面对投资人的时候,也会像面向公众的时候,大谈 AGI 大谈它们的进步,却对这些时效问题闭口不谈吗?这种态度的区别,说明了什么呢?你的道德标准可能比较低,认为这没有什么问题。我的标准跟你不一样。

    另外我上面的回复也没有针对你啊,你这刻薄的毛病从哪儿来的。
    1 小时 57 分钟前
    回复了 sillydaddy 创建的主题 分享发现 Scaling Law 真的很有意思!它停止了吗?
    @iloveoovx 一旦 RL 缩放放缓,虽然还有其他优化空间,但是会直接影响 scaling 的速度。

    另外,我发这个,也是说明我对这些 AI 公司很不信任:连这些基本的信息,他们都不会放出来,比如我们的 RL 缩放还能支持多长时间之类的话。从我发的主题里面的评论可以知道,大家基本都靠猜。

    如果这么基本的无害的信息,他们都要闭嘴不提,我根本不能相信这些 AI 公司能有什么透明度和操守。话倒是都说得很漂亮。
    5 小时 16 分钟前
    回复了 sillydaddy 创建的主题 分享发现 Scaling Law 真的很有意思!它停止了吗?
    @JoeJoeJoe 搜集资料时,我也问了 AI ,😂
    3 天前
    回复了 mswh 创建的主题 新手求助 铜币现在在哪可以看?
    人说前门楼子,你说胯骨轴子。人说结构性失业,你说程序员自虐。确实是鸡同鸭讲。
    2 月 26 日
    回复了 constantine008 创建的主题 问与答 非常看好 AI,应该做什么
    @6581 这个问题价值上百万,我不会白白告诉你。 :doge
    能免费告诉的只有这些:可以试试列出现在 AI 还不擅长的,然后看看里面有哪些不容易低成本实践、获取数据、验证。这些就是近未来 AI 不擅长的人类高地。
    2 月 26 日
    回复了 shyrock2026 创建的主题 程序员 现阶段的 AI 你很难说它算一个员工。。。
    AI 有些懒!这也许是训练导致的偏好。

    我在做的一个 gtd 工具,让 AI 加啥就加啥,让它改啥就改啥。但一点主动性都没有。每次我都自己试用后,看缺哪些关键功能。后来,我灵机一动,让 AI 自己看还欠缺哪些核心功能,原 prompt 是这样的:

    「你来总结一下这个项目,目前从功能上来说,还欠缺哪些功能?仔细看看,还有哪些影响基本可用性的。」

    它吭哧吭哧列出 3 个大的功能缺失:任务删除、目标删除、目标编辑。然后我就让它修复掉,很丝滑。

    所以,你需要另外一个 AI 或者另开一个对话,来监督和测试它,而不是指望它自己监督自己,AI 很懒。就你的情况来说,你只需要一句极其简短的提示词:“请针对这个功能执行冒烟测试,并将测试结果输出到 issues 中”
    2 月 26 日
    回复了 wienli 创建的主题 职场话题 34 岁大龄失业程序员的迷茫。。。。。。
    分情况。需要集中注意力的任务,3 小时算是非常不错了!再长了,人受不了!除非精力超级旺盛。或者对任务感兴趣。我有过连续 1 天都在高强度思考和实践的,但毕竟是特殊情况。一般在工作中遇到的任务,不反感就不错了,即使是做自己的副业,也往往是只对目标很享受,但实践过程往往要经历意志的磨练,说白了就是过程比较痛苦。

    因为之前确实遇到过畏难情绪导致的拖延,无论是公司的工作还是自己的项目。所以目前,我在尝试实践你所说的,也就是把这些不同类型的任务分开处理,具体就是,比较痛苦需要消耗注意力的主任务,放到一起处理(有 Youtube 博主说 5 点起床到 8 点);琐事杂事不得不做的任务放到一起处理(比如集中半小时来一起做);比较享受的任务可以放到一起;痛苦任务中可以安插一些短时的休息。
    2 月 14 日
    回复了 extrem 创建的主题 程序员 AI 编程后,我体会到了当 boss 的感觉
    “领导半夜都在拉会,看起来精力无限是因为他们根本不用做执行,大脑决策的频率远低于牛马们”,说得太好了,确实是这么个理儿,领导只要结果,领导需要的脑力消耗比开发少太多了。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5605 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 08:55 · PVG 16:55 · LAX 00:55 · JFK 03:55
    ♥ Do have faith in what you're doing.