V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  TimePPT  ›  全部回复第 13 页 / 共 141 页
回复总数  2815
1 ... 9  10  11  12  13  14  15  16  17  18 ... 141  
2025 年 2 月 8 日
回复了 EeveeRibbon 创建的主题 问与答 有没有推荐的学习写大模型提示词的资源
御三家官方指南:
https://platform.openai.com/docs/guides/prompt-engineering
https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview
https://ai.google.dev/gemini-api/docs/prompting-intro
配合各家的 cookbook (就不放链接了,官方站点都有),基本搞定常见九成 Prompt 撰写

PE 的常见概念科普:
https://www.promptingguide.ai/zh

OpenAI o1 / DeepSeek R1 这类推理模型,Prompt 撰写和之前的 LLM 略有不同,感兴趣看这篇
https://www.latent.space/p/o1-skill-issue

以上看完,比市面上一堆所谓 Prompt 技巧管用的多
2025 年 2 月 7 日
回复了 mingtdlb 创建的主题 Local LLM LLM 私有化部署
模型的私有化部署一直有。

前 GPT 时代,模型参数都没那么大( BERT 这种),基本上企业自部署的比较多。
GPT 时代,一般私有化部署的都是 100B 参数以下的模型。
一般本地台式机 or 笔记本的本地部署,参数量级在几十 B 以下( 10B 以下极轻量级最常见),适当做些量化处理,基本上都能跑。

现在营销号推的 DeepSeek 本地部署的,绝大部分其实指的是蒸馏过的小模型。
同道中人,大枣泡水一直最爱!
2025 年 2 月 5 日
回复了 luckzk 创建的主题 问与答 一个月后准备拍婚纱照,有什么避坑攻略吗
- 前一天好好休息
- 有耐心
- 有分歧听老婆的
2025 年 2 月 3 日
回复了 subtleworks 创建的主题 JavaScript ChatGPT 语音对话技术
OpenAI 自家 API ,支持 WebRTC 的
北京的联通单宽带之前办过,总体就比较不划算。

可以试试找个熟人朋友,有富余的套餐里的宽带(比如移动月套餐满多少送一根宽带这种),转租一下,还能帮人分担点成本。
也可以找营业厅小姐姐,看有没有套餐拆包卖的——这个其实违规,但好多营业员都这么干的。
2025 年 2 月 2 日
回复了 teli 创建的主题 问与答 互联网服务产品如何直播带货?
看看百度网盘,WPS 怎么在抖音卖会员的
2025 年 2 月 2 日
回复了 Hawthorne 创建的主题 macOS 大家都用哪个键唤醒系统?
@Hawthorne 我一直没有哎,屏保状态 or 息屏时候,直接回车就进输入密码状态了,然后就按下电源键/TouchID 直接进了
不过想想其实直接 TouchID 最省事,哈哈
2025 年 2 月 2 日
回复了 Hawthorne 创建的主题 macOS 大家都用哪个键唤醒系统?
万年回车
有研究表明,预训练时使用多语言语料是有助于智能提升,且多语言在底层是 Align 的。
2025 年 1 月 30 日
回复了 las917vki 创建的主题 Apple Apple 日区 ID 没有办法使用国内和香港的 JCB 卡绑定了
@las917vki 其实还好。
我一直官网买美区卡。十年下来花了几千刀了,一直没问题。
2025 年 1 月 29 日
回复了 8eacekeep 创建的主题 问与答 新年快乐!大家会进行赛博大扫除吗?
平日里随时整理,所以没这计划😂
2025 年 1 月 24 日
回复了 timerring 创建的主题 程序员 尝试了 trae 后,我为 cursor 续费的心有点动摇了...
出来第一天就试了下,Agent 能力不如 cursor ,tab 补全有些拉。
胜在白嫖。其他我感觉没啥优势。
期望各家都卷起来,对普通用户是好的哈哈
2025 年 1 月 22 日
回复了 lurui45 创建的主题 机器学习 大模型能记住所有它训练过的数据吗?
你可以简单理解为,模型的训练阶段,通过学习极大量语料,获得了词元( token )间的前后脚出现的概率。

等推理阶段,通过获取上文所有词元组成的 context ,输出最有可能的下一个词。

所以,理论上,如果红楼梦作为了语料进入训练。在 context 足够明确的情况下,让补全红楼梦,是可以做到的。但因为预测的是下一个 token ,那么下一句是否正确,也取决于其他训练语料。甚至还有其他影响,就不多展开了。

如果感兴趣,还是建议找点机器学习、深度学习的科普资料读一下。
2025 年 1 月 22 日
回复了 oktp123 创建的主题 推广 教程:如何从 OpenAI 平滑迁移到 DeepSeek
@Livid 推广
2025 年 1 月 21 日
回复了 felix9ia 创建的主题 Web Dev 应不应该把主键 id 暴露在 url 上?
@chendy 完全同意,其实主要问题就是推断业务增长情况,和遍历爬虫(一个冷知识:QQ 邮箱的数字 @qq.com 也有类似问题所以一开始入信反垃圾策略就很严格),其他没啥大问题。

我新项目一般数据库用 PostgreSQL ,唯一 id 使用 uuidv7 ,传给前端 url 外显时候使用 url safe 的 base64 显示了,除了丑点没啥其他副作用。
这个实用,感谢!
不用想了,你这需求是事实性信息查询,且有一定实效性(地名、地址、电话都会随着时间变化),没有外部算法工程约束的情况下,大模型幻觉是不可避免的。最好就是结合外部权威信息作为 context ,让模型去做整理( Long context input or RAG )
1 ... 9  10  11  12  13  14  15  16  17  18 ... 141  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2307 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 42ms · UTC 01:16 · PVG 09:16 · LAX 18:16 · JFK 21:16
♥ Do have faith in what you're doing.