Home Sign Up Sign In

GPLer's recent timeline updates

GPLer

V2EX member #353984, joined on 2018-10-05 16:11:10 +08:00

Today's activity rank 15271

GPLer 提问技术话题好玩工作信息交易信息城市相关

创造了 uv 的 Astral 公司被 OpenAI 收购

Python • GPLer • Mar 20 • Lastly replied by GPLer

7

中国区用户的海外 Unity 资源商店的访问权限将于 2026 年 3 月 31 日终止

UNITY • GPLer • Mar 3 • Lastly replied by GPLer

8

Bun 被 Anthropic 收购

分享发现 • GPLer • Dec 4, 2025 • Lastly replied by CWorld

29

通过新加坡的服务器使用 bing 进行搜索，结果全是知乎

全球工单系统 • GPLer • Oct 22, 2024 • Lastly replied by GPLer

2

Haystack Editor source-available

Visual Studio Code • GPLer • Sep 26, 2024

是否存在无默认行为的代码格式化工具

程序员 • GPLer • Aug 16, 2022 • Lastly replied by secondwtq

18

纯前端有哪些像程序员三大浪漫这样可以持续深入学习的研究方向

前端开发 • GPLer • Jan 12, 2022 • Lastly replied by agdhole

4

国外研究员发现一个 Chrome 的远程代码执行漏洞

Chrome • GPLer • Apr 15, 2021 • Lastly replied by GPLer

2

如何击杀互相调用的程序？

问与答 • GPLer • Feb 13, 2021 • Lastly replied by zszhere

10

免费网游加速器“流星”的马脚露出来了？

信息安全 • GPLer • Aug 17, 2020 • Lastly replied by ashtwo

13

» More topics by GPLer

GPLer's recent replies

2 days ago

Replied to a topic by mode171 › 教育 › 本科毕业又能读大专了，全国多地鼓励进大专院校进修，你怎么看？

“专业本科起点专科学习，修完教学计划规定的全部课程，成绩合格，准许毕业“
毫无违和感

4 days ago

Replied to a topic by yzw7489757 › Cursor › 如果 Xspace 收购成功，应该叫什么

xcodespace 或 codespacex

11 days ago

Replied to a topic by inyfee › ☕Vibe Coding🤖 › 当你一个任务跑一半触发了 5 小时限制的时候，你会怎么办？

开 1m 上下文，提示词要求任务完成之前不要暂停，额度到了不触发压缩已有任务会继续跑。

13 days ago

Replied to a topic by archxm › 程序员 › RAG 难以让人满意啊

@GPLer 另外因为目前看下来还是稠密模型能力强，所以一般不推荐 AI Max+ 395 128GB 和 DGX Spark 128GB ，跑 27B 模型速度太慢没法用，苹果只是单纯力大砖飞+高性价比所以才写上去了。

13 days ago

Replied to a topic by archxm › 程序员 › RAG 难以让人满意啊

@akadanjuan101 可以的
gemma4 31b 没有官方量化，我还在找合适的使用方式
qwopus 我最近在试，这个因为是非官方的我没写，确实忘了😂

13 days ago

Replied to a topic by archxm › 程序员 › RAG 难以让人满意啊

@Enivel FTS 一开始没反应过来，查了下这不就是双路召回的其中一路吗，都 2026 年了，早就标配了。

13 days ago

Replied to a topic by archxm › 程序员 › RAG 难以让人满意啊

@akadanjuan101 所以你 40g 显存目前用啥模型啊

13 days ago

Replied to a topic by archxm › 程序员 › RAG 难以让人满意啊

@akadanjuan101 但是这种现在没有全新的了，容易买到矿，本身也是魔改卡，质保也是个问题，所以我说了有丐的方案但是不推荐 😂

13 days ago

Replied to a topic by archxm › 程序员 › RAG 难以让人满意啊

@Lykos 我自己有一张 3090 24g ，35b 和 27b Q4 用 Ollama 勉强能跑，但是上下文开不高，还是推荐 5090 32g 或 4090 48g ，另外 mac m5 max 64g 版本也是不错的选择，算下来整机成本大概 3w ~ 4w 左右，再往上家用就太贵了。

本来 24g 显存显卡最合适的是用 vllm 跑 27b q4 ，但是 qwen 官方量化的 q4 有问题，权重和 fp8 一样大，只能等 qwen3.6 27b 再看看了。

目前公司里用 A6000 48g 和 4090 48g 在用 vllm 私有化部署模型，48g 显存部署 fp8/q8 精度上下文能拉满原生 256k 上下文，非代码类任务用用还行。

---

另外如果不要求长上下文的话，27b 模型 16g + gguf 极限量化应该也能跑，35b 模型内存+显存混合使用应该也能跑，不过我没试过，所以不做推荐

---

丐的方案也有，比如 v100 32g x4 、2080ti 22g x2 、3090 24g x2 、m1 ultra 128g 、m2 ultra 128g/256g ，但是这些方案要么太老要么功耗太高又没质保，并且我没试过，所以就不推荐了。

13 days ago

Replied to a topic by archxm › 程序员 › RAG 难以让人满意啊

@GPLer 另外目前家用最强的模型 gemma4 31b 、qwen3.5 27b 、qwen3.6 35b_a3b ，如果要测试最好在这三个里选，测试下来稠密模型效果比激活参数小的 MoE 模型好很多。

» More replies by GPLer

About · Help · Advertise · Blog · API · FAQ · Solana · 2707 Online Highest 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 27ms · UTC 14:56 · PVG 22:56 · LAX 07:56 · JFK 10:56
♥ Do have faith in what you're doing.