qwen 本地大模型的问题

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

我的机器是 M1 Pro ，32G 内存，部署本地模型主要是两个需求：

我一开始使用的是 qwen3.5-9b 和 qwen3.5-4b 的模型，测试的时候，可以用，但是在实际跑起来的时候，发现 qwen 会无限思考，经常 10 分钟都没有任何响应；后来换成了 qwen3-4b 的模型，效果比较好，很少出现无限思考的问题

3 条回复 • 2026-04-02 18:11:40 +08:00

lagrange7

3 天前

是不是启动的时候设定不思考，会好一些？

xiaoz

3 天前 via Android

你直接调用参数里面设置下禁止思考呗。

workbest

3 天前

没有 disable 思考，设置了最大思考 token ，没用