• 请不要在回答技术问题时复制粘贴 AI 生成的内容
Cheez
V2EX  ›  程序员

阿里的 Qwen3.7-Max 比我想象中差

  •  
  •   Cheez ·
    PRO
    · 22h 16m ago · 2660 views
    19 replies    2026-06-08 13:58:54 +08:00
    Cheez
        1
    Cheez  
    OP
    PRO
       22h 13m ago
    说实话才一百多万而已,Qwen 就已经撑不住了。撑不住就算了,也不会自动压缩上下文。用 GLM 5.1 之后开始干活了,结果干到一半,Qoder 显示没额度了,也就是说一个月的额度,连一个最简单的 App (给定接口,进行显示统计信息)都没干完,就已经花光了。
    qxmqh
        2
    qxmqh  
       21h 55m ago
    Qoder 阿里系的 都是洪水,疯狂消耗,不知道他们这些产品 都是怎么搞的。
    foufoufm
        3
    foufoufm  
       21h 48m ago
    这段时间软文很多
    coderfee
        4
    coderfee  
       19h 59m ago via iPhone
    kimi 也这样,一直 read 文件,狂耗额度。
    ZX16815
        5
    ZX16815  
       19h 56m ago
    有没有可能,这是你本地 agent 调度出问题了,或者 ui 出 bug 了😀
    Cheez
        6
    Cheez  
    OP
    PRO
       19h 31m ago via Android   ❤️ 1
    @ZX16815 没听懂。Qoder 你用过吗?是阿里版本的 Cursor 。我登录并注册了 Qoder ,在里面输入我需要的,然后它的 Qwen 模型给我的是无限循环,换成 GLM 好了。这不就是它的锅吗?
    lmmlwen
        7
    lmmlwen  
       18h 59m ago   ❤️ 1
    用不了 codex 和 claude ,用 cursor composer2.5 秒杀这些国产的玩意儿
    MuyuQ
        8
    MuyuQ  
       17h 51m ago
    无限循环是 qwen 系列不得不品的一环。
    上上个月,我用 3.6Plus ,一会儿的功夫给我写了几 K 行循环代码。
    bowser1701
        9
    bowser1701  
       17h 41m ago
    这个跟模型没有关系吧?就算有问题,也是推理服务的问题。
    SilenceLL
        10
    SilenceLL  
       16h 33m ago
    我在 Qoder idea 插件里面用 qwen3.7 的模型,搞了一个小时没搞定的一个问题,用 Codex 两分多钟搞定。涉及输入输出 4K+行的 json 文件和一个 ERP 项目的前后端。最后逼急了他说是我改了数据导致两个接口返回不一致,不是代码问题,Codex 一下子就发现了前端渲染数据方式有问题。
    cpalead
        11
    cpalead  
       15h 45m ago
    我在 trae 中用 deepseekv4pro 的时候也这样,好几次它问我重复的问题,或者重复做一件事
    kennylam777
        12
    kennylam777  
       13h 18m ago
    @bowser1701 通常都跟模型有關, 長 context 是一種能力, Qwen 的收費版才有 1m context support, 但在 1m 觸發 compact 前就死循環那是長 context 能力不足了。

    雖然我在本地用 Qwen 3.6 27B/35B 都只限在 256k 甚至是 200k, 不太會死循環, 但如果把 Weight 或 KV 壓成 4bit/Q4 就更容易會出現類似錯誤。

    雖然在 inference 時的確能調 repeat penalty 去減少重覆回應, 但我測過能力弱的模型, 要死循環時你如何調也救不回來。
    jjx
        13
    jjx  
       5h 53m ago
    国内的这几个用下来还是 deepseek 最靠谱

    deepseek 需要快出自己的 agent code 工具
    xiangqiankan
        14
    xiangqiankan  
       5h 23m ago
    真实体验太差了,尤其是指令遵循是最差的,qwen 真的是跑分没输过,体验没赢过。阿里的东西和上次那个 happy-horse 一样说世界第一超越 seedance2.0 ,结果实测拉跨打脸
    benfafa
        15
    benfafa  
       4h 57m ago
    我周末一个小时送的 pro 的点数全用完了,
    收费也很离谱
    Tarek911
        16
    Tarek911  
       4h 13m ago
    200 块/月的 TokenPlan 额度,Qwen3.6 蹬了一周才蹬掉 20% ,换了 3.7Max 没到一周就清杯了,也就做了三五个小功能。
    DeepSeek 充了 100 块,库库蹬,比 tmQwen3.6 还省钱,虽然输出规范差了点意思,但胜在偏移能用,智能水平跟 3.6 不相上下,但感觉不如 3.7
    champaulmmc
        17
    champaulmmc  
       3h 59m ago
    这个是伪流式,一般是中转代理为了给不支持流式输出的模型嵌套的,就会出现一直疯狂打印某一个步骤,当然有的 agent 工具对模型适配不行也会这样
    0xD800
        18
    0xD800  
       3h 46m ago
    我相信做过 agent 开发的用户都遇到过无线循环的问题,通常 agent 会设置循环限制,不会无限循环(烧钱),很明显是模型能力不足以及客户端 Agent 不够完善导致。
    gloeaerris
        19
    gloeaerris  
       47 mins ago
    @lmmlwen 确实,蒸馏的秒杀被蒸馏的。千问 code 确实是不行,跟 minimax 坐一桌,kimi 自己呆一桌或者跟 composer 坐一起,GLM 跟 DeepSeek 配合 claudecode 或者 codex 还算是可以,不过新版的 claudecode 针对 deepseek 负优化,用 codex+deepseek 或者 zed 编辑器+deepseek 效果好很多
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5595 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 78ms · UTC 06:46 · PVG 14:46 · LAX 23:46 · JFK 02:46
    ♥ Do have faith in what you're doing.