V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  h4nru1  ›  全部回复第 7 页 / 共 7 页
回复总数  140
1  2  3  4  5  6  7  
@Justin13 你会反代的话,codex 订阅的额度随便拿出来用
@darksword21 我是博士≠我说的对 你是学渣=我有种认知低下的美
@Razio Claude 模型和 Claude code 是一样东西吗
@utodea 技术报告和代码都开源。可以详细看看。一句话两句话说不完。。
@Justin13 对于不折腾的人来说 codex 和 cc 是最佳选择
@rtv 哪一篇 benchmark 论文没有在对比?所以都是贬低吗?讨厌纸上谈兵的半吊子随便否定别人。另外,1 、我贬低 cc 了吗? 2 、oc 不垃圾吗? 3 、你说的 op 是啥?
@horizon 那有点多。。
@K332 建议看技术报告的 2.1 章节。如果你感兴趣我可以再开一篇帖子详细讲讲。推荐你看一下这三篇论文: https://arxiv.org/abs/2307.03172
https://arxiv.org/abs/2410.18745
https://arxiv.org/abs/2302.00093
上下文长度的选择不光是从成本的角度考虑。
@K332 省 token 、自进化。还不够吗?
@thet 我帮你催催开发者让他们再降点门槛
@giter hhh ,正是如此。感谢你帮我说出了心里话
@defunct9 何不把 key 和 github 链接给 Hermes ,让他帮你装?如果他这都做不到,你留他有什么用?
@Dream4U 对这种把 benchmark 结果当贬低、把数据对比当吹牛的阅读理解能力,直接理解,跪久了的确站不起来。
@fj19 算,但是你如果花了 5 分钟体验的话,你会感谢我的
@stimw 这些数据集里的数据都是 user-assistant 的对话堆起来的,然后让模型去 recall 用户提及的细节、偏好等等;但是现在 agent 的模式是任务式的,user 说一句,assistant 要跑好几十轮,召回的主体也从用户细节变成了任务细节(实现 task 中的某个具体步骤)。那原先的测评明显就不合适了。。
@defunct9 而且有 webui 的应该。。前端确实烂
@zzzzz024 支持反代,不过反代要你自己整一下。建议左脚踩右脚(先买 ds 的 api ,然后让配了 ds 的 ga 帮你弄反代)
@defunct9 为什么?你的 linux 有 python 环境直接 python agentmain.py 不就好了。。
1  2  3  4  5  6  7  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1188 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 17:41 · PVG 01:41 · LAX 10:41 · JFK 13:41
♥ Do have faith in what you're doing.