GLM5.2 个人感觉有点被吹大了

前几周用了几天 Claude-fable-5 模型，确实很明显的感觉准确率非常高，理解能力也非常高，基本一遍过。在这个之前我大部分使用 Opus4.8 以及 Sonnet4.6, 理论上我用 sonnet 4.6 更多。

这段时间看 GLM 这么火，我也凑热闹去抢了下，一直没抢到，干脆购买了国外版本的 z.ai 的套餐。这几天重度使用了一下，说说我的感受：

前提：我都是用的 claude code cli

GLM5.2 有点话痨，有的时候说一堆话，甚至大段重复，不够言简意赅
1. GLM5.2 对整个项目的把控不如 claude code ，要 GLM 做一个功能，他有时不先去看程序是不是有什么已经做了的，或者是否影响别的地方，就是感觉整个考虑不周到，要我来指正。我明白很多时候需要描述更清晰需求，但是有的需求应该是显而易见的。这点我感觉全局上，fable > opus > sonnet > glm
慢，卡，经常一个小问题，要搞好几分钟，明显提赶上 claude 效率要更高。

所以总结起来说：相对目前所谓可用模型第一来说，我觉得 GLM5.2 过誉了，理解能力欠缺，整体把控能力不够，效率不够高。总的来说也是国产模型里面一梯队的，但是和 claude 确实还有半年到一年的差距。

PS：个人意见，很主观，仅供参考。

Supplement 1 · 14h 29m ago

官方：For coding tasks, we recommend using max effort to enable deeper reasoning and more stable performance on complex tasks.

我之前 Claude Code 的 effort 默认是 high ，刚才切换 max 后感觉好不少，不知道是不是错觉，还需要深度体验一下 max effort

glm5.2

Claude

模型

18 replies • 2026-06-20 14:24:27 +08:00

wombat

1 day ago

确实是这样。昨天对比了 GLM5.2 ，Cursor Composer2.5 ，GPT5.5 ，Opus4.8 。确实 GLM5.2 还是有差距。慢的话，可能是因为部署的问题？ zai 的算力不足？但相比 GLM5.1 ，确实提升了不少，特别在多 agent 任务上，但感觉思考深度更深，时间更长，知识比较老。