hihihihihi
V2EX  ›  Local LLM

GLM5.2 个人感觉有点被吹大了

  •  
  •   hihihihihi · 1 day ago · 4532 views

    前几周用了几天 Claude-fable-5 模型,确实很明显的感觉准确率非常高,理解能力也非常高,基本一遍过。在这个之前我大部分使用 Opus4.8 以及 Sonnet4.6, 理论上我用 sonnet 4.6 更多。

    这段时间看 GLM 这么火,我也凑热闹去抢了下,一直没抢到,干脆购买了国外版本的 z.ai 的套餐。这几天重度使用了一下,说说我的感受:

    前提:我都是用的 claude code cli

    1. GLM5.2 有点话痨,有的时候说一堆话,甚至大段重复,不够言简意赅

      1. GLM5.2 对整个项目的把控不如 claude code ,要 GLM 做一个功能,他有时不先去看程序是不是有什么已经做了的,或者是否影响别的地方,就是感觉整个考虑不周到,要我来指正。 我明白很多时候需要描述更清晰需求,但是有的需求应该是显而易见的。 这点我感觉全局上,fable > opus > sonnet > glm
    2. 慢,卡,经常一个小问题,要搞好几分钟,明显提赶上 claude 效率要更高。

    所以总结起来说:相对目前所谓可用模型第一来说,我觉得 GLM5.2 过誉了,理解能力欠缺,整体把控能力不够,效率不够高。总的来说也是国产模型里面一梯队的,但是和 claude 确实还有半年到一年的差距。

    PS:个人意见,很主观,仅供参考。

    Supplement 1  ·  14h 29m ago
    官方:For coding tasks, we recommend using max effort to enable deeper reasoning and more stable performance on complex tasks.

    我之前 Claude Code 的 effort 默认是 high ,刚才切换 max 后感觉好不少,不知道是不是错觉,还需要深度体验一下 max effort
    18 replies    2026-06-20 14:24:27 +08:00
    wombat
        1
    wombat  
       1 day ago
    确实是这样。 昨天对比了 GLM5.2 ,Cursor Composer2.5 ,GPT5.5 ,Opus4.8 。 确实 GLM5.2 还是有差距。慢的话,可能是因为部署的问题? zai 的算力不足? 但相比 GLM5.1 ,确实提升了不少,特别在多 agent 任务上,但感觉思考深度更深,时间更长,知识比较老。
    woodnaonly
        2
    woodnaonly  
       1 day ago
    Cursor Composer2.5 也能放到 GPT5.5 ,Opus4.8 一个梯队了?
    @wombat
    wombat
        3
    wombat  
       1 day ago
    @woodnaonly 整体智力上肯定不行。但写日常代码我用起来感觉有点 opus 的感觉。 主要 Composer 速度快,干活还可以。
    wombat
        4
    wombat  
       1 day ago
    @wombat 模型各有各的优点,我觉得 composer 是能干活的,行动不拖泥带水,比 GLM 的行动更简洁。 个人比较喜欢。
    toubi
        5
    toubi  
       23h 5m ago
    glm5.2 还是可以的,每个人的项目不一样,所以每个人用下来都是有不同感觉的。我整体感觉下来和 gpt5.5 大差不差。至于你说的慢卡,你可以去使用硅基流动的,速度超级快,30 多分钟就花了我 30 元。
    MuyuQ
        6
    MuyuQ  
       22h 55m ago
    你都把 glm5.2 和 4.8 放一起对比了。
    已经是巨大的进步。
    期待 glm6.
    huanxianghao
        7
    huanxianghao  
       22h 38m ago   ❤️ 1
    Opus4.8 感觉也挺降智,让它编辑个文档,还给我搞重复内容了
    zxjxzj9
        8
    zxjxzj9  
       22h 27m ago
    @woodnaonly 快就是好,好就是快.... 天下武功唯快不破
    weiyunjun
        9
    weiyunjun  
       21h 42m ago
    你居然还真的花钱测试国模啊,有点震惊。不过长个记性也好。下次冲动的时候去隔壁站先看看有没有白嫖的渠道。理性消费!
    woodnaonly
        10
    woodnaonly  
       18h 48m ago
    @zxjxzj9 请多多支持豆包
    herozzm
        11
    herozzm  
       18h 40m ago   ❤️ 1
    请问你国内哪一家大模型不是过渡吹捧的?你不吹就没人用
    一坨屎也吹成金凤凰
    wolfie
        12
    wolfie  
       18h 38m ago
    试试 gpt-5.5 看看什么叫废话连篇
    NewYear
        13
    NewYear  
       16h 44m ago
    国内的为啥一直追不上第一梯队呢

    难道是因为语料太少,还是因为人家国外的买书扫描进去做语料所以更加聪明?
    YanSeven
        14
    YanSeven  
       16h 7m ago
    @NewYear 从根儿上就缺卡
    v400127
        15
    v400127  
       14h 7m ago
    宣传是有些过,目前做些不疼不痒的东西还行,比 minimax3 好多了
    royo
        16
    royo  
       13h 32m ago   ❤️ 1
    不要看模型怎么说,看他们的定价。如果国产这些模型真的追上甚至超越 claude 和 gpt ,要么这个模型涨价、要么 claude 和 gpt 降价,资本最诚实了。
    nVic
        17
    nVic  
       6h 25m ago
    他们花了大量钱买评论喔,代码质量也就那样。
    crocoii
        18
    crocoii  
       24 mins ago via Android
    claude 家只有 fable 还可以,opus 降智降的感觉都不如 deepseek 了。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2491 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 59ms · UTC 06:49 · PVG 14:49 · LAX 23:49 · JFK 02:49
    ♥ Do have faith in what you're doing.