$V2EX
Solana
Give SOL to Copy Address
使用 SOL 向 sillydaddy 打赏,数额会 100% 进入 sillydaddy 的钱包。
 sillydaddy's recent timeline updates
sillydaddy
5.47D
5.14D

sillydaddy

V2EX member #472822, joined on 2020-02-27 19:30:20 +08:00
Today's activity rank 118
MOD
Has privileges to move topics
sillydaddy's recent replies
目前已有的理解能力,再加上缺失的持续学习,就是 AGI 了。持续学习是 AGI 缺失的一块拼图。
持续学习的关键是什么呢? LLM 的上下文已经够大了,但是把上下文当做记忆,总感觉不太对劲。

LLM 的一整个权重,可以看作是一个具大的无状态的函数,类似于函数式编程中的纯函数,里面完全没有任何状态,我们知道,纯函数编程的一个别扭之处是,它的效率很低——最近我用 Cavalry 这个动效制作软件就深有体会,它是纯函数,没有状态,相比之下,Origami Studio 就可以保有状态,后者要比前者方便不少——LLM 把所有的状态,都存放在上下文里面。这种函数与状态分离的模式,会不会就是它效率很低的原因呢?不知道,只是瞎猜的。
这两天在用它跑数据搜集、整理的工作( https://v2ex.com/t/907899#r_12559610 ),效果还可以。不过,正如楼上说的,价格不占优势。

命中缓存的 input 价格,是未命中的 1/5 。而 DeepSeek 是 1/50 。本来单价就比 DeepSeek 高,加上缓存就差的更多了。

我跑数据搜集和整理,100 个左右的同质的任务(单个任务比较简单),已经把赠送的 7 亿 credits ,以及$20 的 API 额度,都烧完了。折合几百块钱吧。这要是 DeepSeek ,最多 20 块钱就搞定了(我还没试,只是根据 token 换算的)。
3 days ago
Replied to a topic by NullIsLife 随想 看着 ai 干活心里暖暖的,莫名的舒服
我感觉这就是最纯粹的「熵减」的快乐吧:房间从混乱到被弄齐整,新知识从杂乱到被梳理吸收,精气神在早起时焕然一新。
@samnya 感谢补充。还有带加密的,见识到了。
@bumblebeek 哈哈,原来是这样。
更新下,使用 Claude Code 是可以的。


@bumblebeek 这个代理的原理是什么呢?我问了 AI 说是自动填充之前的 reasoning_content 。


不过,我这里有一个很大的疑问,如果要让模型提供商那里的 KV 缓存起作用,本来就应该把 thinking 的内容传过去吧?否则服务端怎么做前缀匹配然后找到缓存呢?为什么 OpenAI API 兼容协议中,reasoning_content 还会是一个可选项呢?
@pengyvz
@Sezxy
感谢,我先试试 Claude Code 行不行。不行的话我再试试 OpenCode 。
哈哈,这些话我至少有 8 成都说过。
利好 v 站:创意工作者的社区。
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3962 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 43ms · UTC 04:19 · PVG 12:19 · LAX 21:19 · JFK 00:19
♥ Do have faith in what you're doing.