Azure99 最近的时间轴更新
Azure99

Azure99

V2EX 第 296249 号会员,加入于 2018-03-03 18:28:27 +08:00
今日活跃度排名 548
根据 Azure99 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
Azure99 最近回复了
9 小时 51 分钟前
回复了 bankroft 创建的主题 NAS 躁动的心,想入手 emby/plex
一直用 jellyfin + nastool + jackett ,刮削从来不是问题
1 天前
回复了 Azure99 创建的主题 程序员 分享一下自己训练的大模型
@ljx626 算上造数据、实验、训练,大概几千吧。数据和实验是大头,如果只用开源数据集做 SFT 且数据量不大的话,花费很少
1 天前
回复了 Azure99 创建的主题 程序员 分享一下自己训练的大模型
@qW7bo2FbzbC0 个人感觉是因为对齐阶段,缺乏尝试->验证->回溯的数据(对于这种没有确定解题方法的问题,又好比 24 点,或者各类行测找规律的题),这有点像我们人类的思考方式,GPT 也只是有一些这种能力,但不多。
1 天前
回复了 jstony 创建的主题 Windows windows11 什么时候如丝般顺滑了?
只要配置拉到一个水平,windows 一直非常丝滑
1 天前
回复了 Azure99 创建的主题 程序员 分享一下自己训练的大模型
@Contextualist T4 * 2 ,不考虑并发的话 llama.cpp 会快不少。另外 HF 的 Zero GPU 也有免费 A100 40G 可以用了,可惜仅支持自家生态。
1 天前
回复了 Azure99 创建的主题 程序员 分享一下自己训练的大模型
@mightybruce 没太明白这个和 advICL 有什么关系
1 天前
回复了 Azure99 创建的主题 程序员 分享一下自己训练的大模型
@enderftt SFT 的 prompt 里没有 system prompt 的概念,内部 prompt 是下面这样的
A chat between a human and an artificial intelligence bot. The bot gives helpful, detailed, and polite answers to the human's questions.
|Human|: hello
|Bot|:
1 天前
回复了 Azure99 创建的主题 程序员 分享一下自己训练的大模型
@xiaohundun 可以理解成,对于一个指令,调用其他模型的输出作为标注输出。也就是让 GPT4 来标训练数据
1 天前
回复了 Azure99 创建的主题 程序员 分享一下自己训练的大模型
@enderftt 感谢反馈,下个版本会标注下这个 bad case 。另外如果回答不满意,可以点一下👎按钮,会收集的
1 天前
回复了 Azure99 创建的主题 程序员 分享一下自己训练的大模型
@NoDataNoBB
@mightybruce
@xiaohundun
有很多封装好的微调框架,LLaMA-Factory ,swift ,xtuner ,挑个顺手的就行了
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   878 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 13ms · UTC 21:03 · PVG 05:03 · LAX 14:03 · JFK 17:03
Developed with CodeLauncher
♥ Do have faith in what you're doing.