V2EX › rogerer 的所有回复 › 第 3 页 / 共 6 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

1 2 3 4 5 6

❮

❯

2025 年 6 月 3 日

回复了 NeverBelieveMe 创建的主题 › 硬件 › nvlink 能让多个显卡的显存叠加起来用吗？

有很多种方式来并行。最简单的，你如果有 256 个 batch 要训练/推理，那就分成若干份，比如 4 个 64 个样本，这样就能一次推理得到 256 个样本的结果。但是如果模型参数足够大，以至于一张卡装不下，那就得在其他层面进行并行。

2025 年 6 月 2 日

回复了 red13 创建的主题 › 投资 › 房子现在是不是已经不属于优质资产了？

生育率暴跌的背景下还能算优质资产吗？

2025 年 6 月 1 日

回复了 laijh 创建的主题 › 程序员 › 智能体的形式会不会终结?

理论上来说，我们的训练语料能够覆盖到工具的使用，LLM 是可以自己规划的。但是现实是，即使我们考虑一些简单的场景，比如代码检索，LLM 也需要额外的一些信息[1].

举个例子，现在 LLM 写 UI ，它是无法「想象」出来页面长什么样子的，这是一件比较困难的事情，也是 design2code 到现在还在做几十年前的纯 HTML 和 CSS 数据集还取得一个非常低的分数的原因[2]。现在能做的，是把真正运行的结果用各种方式让 LLM 感知到。

[1].Gao Z, Wang H, Wang Y, et al. ViC: Virtual Compiler Is All You Need For Assembly Code Search[J]. arXiv preprint arXiv:2408.06385, 2024.
[2].Si C, Zhang Y, Li R, et al. Design2Code: Benchmarking Multimodal Code Generation for Automated Front-End Engineering[J]. arXiv preprint arXiv:2403.03163, 2024.

2025 年 5 月 30 日

回复了 KingCoding 创建的主题 › 程序员 › 求助：大模型如何处理大量工单数据

没必要用推理模型，推理模型对不需要推理的场景，可能并不能比得过普通的模型。

2025 年 5 月 28 日

回复了 chouqiu 创建的主题 › 程序员 › 如何让 AI 稳定的输出指定 json 结构

1. prompt ，现在 LLM 在对齐阶段一般做过格式的对齐，所以直接让输出 JSON 效果就会不错，如果还是不行把温度系数调一下；
2. 受限解码，大致思想是要求 LLM 的 output 必须符合某个语法结构，如果不行就重新采样。好处是可以保证一定不会出现格式错误，但是这样做的问题是会影响本身的性能，不推荐；

2025 年 5 月 28 日

回复了 itsCoderStudio 创建的主题 › 程序员 › 客户端研发上手后端需要几天？

@itsCoderStudio 有 ChatGPT 怕啥，现在最不需要的就是对具体语法的了解

2025 年 5 月 27 日

回复了 nnegier 创建的主题 › 程序员 › 小米的官方的技术博客在哪儿呀，有在更新吗？

@maocat 有推荐吗

2025 年 5 月 26 日

回复了 RealApe 创建的主题 › 程序员 › 为什么 AI 在传统软件上推进这么缓慢？

@yvescheung Adobe 最近在大量招募做 CV 的人，他们的抠图工具、填充工具都在用新的技术

2025 年 5 月 26 日

回复了 RealApe 创建的主题 › 程序员 › 为什么 AI 在传统软件上推进这么缓慢？

因为 LLM 目前为止主要的用途还是做文本生成。

2025 年 5 月 25 日

回复了 akakidz 创建的主题 › 健康 › 28 岁突发性耳聋，给脑力劳动的各位朋友们提个醒

突发性耳聋治疗时间窗就一星期，错过这一星期是什么样就是什么样了

2025 年 5 月 23 日

回复了 murmur 创建的主题 › 程序员 › 从学习角度来说，不折腾模型精调和模型训练，购买第三方 api 是不是最划算的

是的，自购硬件绝对是不划算的。服务商能跑满 GPU ，基本上不留空闲，个人很难做得到。

2025 年 5 月 21 日

回复了 qsnow6 创建的主题 › Visual Studio Code › 为什么 VScode 的 copilot 这么慢？

@Loocor cursor 做到这件事情应该是先做检索，找到需要修改的片段。这里的难点是，检索出来的内容不一定是唯一需要修改的，所以 copilot 直接做全量 edit 。

2025 年 5 月 21 日

回复了 dbskcnc 创建的主题 › Visual Studio Code › copilot chat 开源且将整合到 core

@dbskcnc 做得确实也不够好，无论是用户体验上还是生成质量

2025 年 5 月 20 日

回复了 pythonee 创建的主题 › Python › 还有类似 pandas 提升运营人员效率的工具么

可能需要一个 BI 平台

2025 年 5 月 20 日

回复了 zfyime 创建的主题 › 分享发现 › 我感觉腾讯元宝的客户端做的还不错

@zfy941 嗯... Claude 的客户端经常卡死

2025 年 5 月 19 日

回复了 zfyime 创建的主题 › 分享发现 › 我感觉腾讯元宝的客户端做的还不错

@zfy941 这一轮 chatbot 的客户端应该基本上都是 web 技术，包括 OpenAI 、Claude 、Gemini 这些

2025 年 5 月 16 日

回复了 zzzain46 创建的主题 › 问与答 › 有没有好用的咖啡随行杯推荐

瑞幸经常会买咖啡液送咖啡杯

2025 年 5 月 16 日

回复了 littlemis 创建的主题 › 问与答 › 请问像是 qwen:0.5b 这种小模型，实际能落地用来做什么

可以用来 debug 。然后很多实验室没能力训更大规模的模型，只能在 0.5b 1b 上试试。

2025 年 5 月 16 日

回复了 AlghaPorthos 创建的主题 › 问与答 › RAG 有什么比较有前景的工程运用嘛？

@AlghaPorthos 幻觉问题可以通过 Knowledge Edit 解决。我并不太同意 RAG 可以解决幻觉，RAG 能做的只是给 LLM 添加一些提示信息，一方面 RAG 本身可能会引入错误信息，另一方面，提示信息并不能避免幻觉的出现，比如在长程推理场景下，RAG 输入的提示信息会被稀释。

另一个 RAG 目前试图解决上下文长度不够的问题。

我认为我们对上下文的需求是有极限的，比如 context window 已经能装下一整个 codebase 了，追求更长的上下文的意义就没那么大。

此外我们还有一些特别的技术比如 context compression 我认为这是比 RAG 解决 context length 更好的方案。

2025 年 5 月 15 日

回复了 AlghaPorthos 创建的主题 › 问与答 › RAG 有什么比较有前景的工程运用嘛？

我始终觉得这是一个中间形态，只是因为现在 LLM 还不够强

1 2 3 4 5 6

❮

❯