V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  BingoXuan  ›  全部回复第 1 页 / 共 157 页
回复总数  3126
1  2  3  4  5  6  7  8  9  10 ... 157  
49 分钟前
回复了 Livid 创建的主题 Local LLM DiffusionGemma
@coefu
但不得不说,阿里的确做出了很不一样的东西。27B 给人的感觉就是在知识面和逻辑和权重大小做了一个很好的平衡。而且训练时候加入 MTP 在本地部署极佳。同时也给人感觉出道即巅峰。这个板块沉寂另外一个原因可能大家有更多时间去做 harness ,而不是部署测试各种模型上。

@kennylam777
我给 Codex 5.4 High 和 27B 给出三个不同的 bug 。27B 可以找到两个(虽然费思考),但 Codex 反而职能找到 1 个。其实本地模型利好 Nvidia 这些硬件厂商,但 Nemotron 系列差强人意。我自己用 RTX Pro 4500 部署,Q6 加上 MTP 有 50tps 。日常使用来说非常流畅。唯一慢的地方是我。哈哈哈哈哈
1 小时 50 分钟前
回复了 Livid 创建的主题 Local LLM DiffusionGemma
@kennylam777
我在 OpenRouter 测试时候,使用同样的 skill ,Gemma4 31B 不能一次完成任务,Qwen3.6 27B 反而可以。本地跑 27B Q6_K 质量不输 OpenRouter FP8 。未试过本地部署 Gemma 31B ,有空再测试一下。目前日常使用 PI+27B 体感上不输给 Codex 5.4 High 。本来还想开一个 Pro ,看来现在完全无必要。

另外如果按你所说,那么 Gemma 31B 的表现可以推算出其本身是为了泛用而训练的。训练语料并没有偏重在 coding 方面。

现在大厂都选择闭源来实现更高利润率,最近几个月开源模型越来越少。尤其是 3.7 系列推出那么久都没有任何开源模型就说明 3.6 27B 大概率绝唱。而且 0.8B/4B/9B 也没有后续了。AI 真实成本远比现在使用 coding plan 或者 api 更贵。开源沦为赚取名声的途径。
4 小时 51 分钟前
回复了 Livid 创建的主题 Local LLM DiffusionGemma
@coefu
Qwen 感觉应该是放弃开源了,虽然 Gemma 开源比不上 Qwen ,但在现在这种环境下,真的是贵在坚持和创新

@kennylam777
现在 3.6 27B 还不错,但是怕是绝唱了
5 小时 6 分钟前
回复了 ttgo 创建的主题 Apple mbp m1 pro 挺耐用啊,战力大于 m4?
本地 llm 推理还没普及情况下,m1-m5 都没有什么太大差别。今年再续一次 ac+,再战 2 年
1 天前
回复了 zfree 创建的主题 iMac 2019 款 iMac , 5K 屏,改不改显示器呢?
拆了清灰换硅脂看看再说,最小化修改。反正 macOS 支持不是还有一年么?不行也能装 Linux
2 天前
回复了 missx 创建的主题 Apple 一年一度,苹果 wwdc 大会讨论帖
估计会深化 iPadOS 和 iOS 和 macOS 融合。为了折叠 iPhone 和折叠 Mac
5 天前
回复了 plko345 创建的主题 Windows windows 终将成为最好的 Linux
感觉不会比 msys2 更好。真正蛋疼的 widnows 编译系统走的是另外一套,gcc 能在 macOS/Linux 上用。同时包管理器又要怎么解决?还有一点,请问 2026 年到底要用哪个开发 Windows GUI !!!!!都那么多年,都没有一个官方长期支持稳定的 GUI 。我猜明年就来一个 AI Native 的新 GUI 框架
5 天前
回复了 CatCode 创建的主题 Local LLM Gemma4 12B 如何跑在 16G 显存上?
@yuping913
unsloth 的 mtp 量化提示暂不支持 mmproj ,周末有空研究一下
6 天前
回复了 CatCode 创建的主题 Local LLM Gemma4 12B 如何跑在 16G 显存上?
gemma 真的没用心做。openrouter 的 api 测试 3.6 27B 都比 31B 好。最近一直测试 Q6_K 量化版本,加了 MTP 加速后,质量并没有损失太多。可惜 MTP 没有视觉,不然加上 web search ,几乎可以和 deepseek4 pro 一拼
9 天前
回复了 kcerty 创建的主题 生活 在一起一年,今天真正分手啦
说明你身体还没意识到,或者更深层的意思并没有完全接受这个现实。这条路还很漫长
@terranboy
类似内部流程系统,只是从人变成了半成品
我常用的测试 case 中:Qwen3.6-27B 加上 Skills 可以很好完成任务,就是费上下文和执行起来有点固执,但 gemma 31B 编码一堆问题。DeepSeek V4 Pro 反而可以一次完成。
找一下「门锁 电磁锁」

24V 供电给电磁锁,额外找个 24V 转 5V 供电给 esp32.esp32 的 GPIO 输出控制继电器控制门锁。不会画板子,300 块找人画,嘉立创免费打板。你觉得稳定性不行,那就花钱上第三方定制。
想办法聊两句,建模好,直接问
5 月 22 日
回复了 tracymcladdy 创建的主题 Apple 现在一代的 studio display 二手挺适合入手的
默默打开了淘宝,看了一下我的 diy 5k 已经 6 年半了。虽然红边是通病,但不碍事。不知道会不会用 10 年。
榴莲刺有些很尖锐,扎进手后会断掉最尖锐部分。上周才千辛万苦拔出来。
最近之前合作的客户找我重新做一个新的工厂用的测试框架。新的框架全程都是 vibe coding ,功能上我觉得比起某消费电子大厂使用的测试框架要好不少。现在代码膨胀到 11k ,复杂度仍然可控。加需求 ai 很快就能处理好。5 分钟解决问题,别的同行恐怕要折腾一晚上。

vibe coding 要确保自己能理解整体运行逻辑,而不是代码细节。用 vibe coding 验证想法,再把想法放到现实中验证。
5 月 7 日
回复了 PinLeak 创建的主题 分享发现 三星的家电业务退出中国市场了
@wshhfy
+1 ,上一台电视也是三星的,还是等离子。用了十年才坏。所以现在这台也是三星,开机快没广告。破坏体验的国产 app
4 月 29 日
回复了 Astralume 创建的主题 健康 十男九痔, V 友们有什么药推荐么?
我的小妙招是到了三点就**走**下去 711 买杯饮料,确保自己每 3 小时能动一下(一次上下楼梯保底 7 层)
1  2  3  4  5  6  7  8  9  10 ... 157  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5449 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 55ms · UTC 07:51 · PVG 15:51 · LAX 00:51 · JFK 03:51
♥ Do have faith in what you're doing.