V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  mumbler  ›  全部回复第 22 页 / 共 107 页
回复总数  2134
1 ... 18  19  20  21  22  23  24  25  26  27 ... 107  
156 天前
回复了 ztm0929 创建的主题 问与答 开源大模型的“源”到底是什么?
@mustcool #6 数据集肯定有严重的版权问题,没法开源
156 天前
回复了 ztm0929 创建的主题 问与答 开源大模型的“源”到底是什么?
@ztm0929 #5 fine-tune 付费服务主要是为算力付费,模型都是免费的,至少现在没收你钱
微信就是个邮箱
156 天前
回复了 ztm0929 创建的主题 问与答 开源大模型的“源”到底是什么?
大模型开源的是权重文件,你可以用自己数据去微调这个权重,而不用从头去训练
@jeffwcx 合理推论,国产模型训练都用 llama 不是什么秘密
156 天前
回复了 XYZ168 创建的主题 分享发现 报道说 OpenAI 今年或巨亏 50 亿美元
已经退订 chatgpt plus ,转投 claude pro 了,artifacts 把我开发效率提升了 10 倍
@xoxo419 当然可以,8B 模型只需要 6G 内存,有 M 芯片加持,速度飞快,mac 包刚刚通过苹果做审核,现在可以下载了
@wanghui22718 下载也是用户体验的一部分,我们初心就是极致的大模型本地部署体验,在任何电脑上开箱即用,不依赖环境,不用具备相关技术知识,all in one
@sunnysab 从零训练一个大模型,是很贵的,开源模型的大爆发就是从 llama 发布开始的,如果 qwen2 是从 0 训练的,也应该跟 1.5 一样有 14B ,32B 这些参数,为什么没有? 因为 llama3 没有
@DaiShu888 正在上传,很快就好
@yekern 赶紧再微调一个 3.1 的,基座比 3 强了不少
@walkingmoonwell 知识库已经很成熟了,可以用 flashai 免费体验一下,硬件有个 gpu 体验更好
@jeffwcx
llama2 有 7b 13b 33b 70b,qwen1.5 有 7b,14b,34b,72b
llama3 有 8b 70b,qwen2 有 7b ,72b
是不是一样的
@gzlock ollama 只是一个命令行,要用图形界面需要安装 webui ,要用知识库需要安装 anything ,对普通人太麻烦,flashai 底层也是 ollama ,集成了图形界面,知识库,不用一个个去安装了,更方便不是吗
@B4a1n 官方没有说正式支持中文,可能中文语料训练得少,国产模型大都基于 llama3 训练的,很快会出来一堆。10B 以下模型里中文能力目前最好的是 gemma2 9B ,英翻中特别厉害
清空 app 缓存就行了,屡试不爽
@SWALLOWW #8 不知道怎么选择,无脑选 gemma2 9B 就行了,中文能力,逻辑能力都一流,特别翻译能力超过 qwen2 ,各种模型排行榜可以看 https://chat.lmsys.org/?leaderboard
1 ... 18  19  20  21  22  23  24  25  26  27 ... 107  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   982 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 367ms · UTC 23:01 · PVG 07:01 · LAX 15:01 · JFK 18:01
Developed with CodeLauncher
♥ Do have faith in what you're doing.