各路大佬们,在用 GLM5 (尤其是用智谱自己的 coding plan 的用户)
想跟大家请教下各位的使用体验,尤其是中小项目的 vibecoding 选手。
我没抢到官方的订阅,所以入手了腾讯的 coding plan ,用了一个月了,我发现个问题
腾讯的 plan 里面其他模型啥事没有都挺正常的 ,只有 GLM5 这一个模型,很傻
vibecoding 里很多时候都要模型自己想自己调工具,一条的上下文会长点甚至要压缩,
但是 GLM5 官方宣称 200+k 上下文,我配置也按腾讯官方的配置文档走的,
实际使用中,100K 左右时就开始出现包括但不限于:死机(反复复读)、失语(输出乱码)、失忆(不会调用工具,思考链疯狂输出代码)、背叛(开始疯狂输出不知道哪来的问题的回答...驴唇不对马嘴)
这个问题我已经开工单在调查中,但是鉴于网上没见过有人吐槽这个问题以至于我都怀疑是不是我一个人克这个模型,
我虚心向各位大神请教各位在使用 GLM 模型(尤其是 GLM5 )过程中是否存在以上问题。
如果不存在,我会去 试着抢一下智谱的 plan ,但我现在就怕智谱自家都这样...那就浪费时间了。
跪谢大佬们抽时间回复...ORz
已结案,应该就是这个模型的问题。5.1上线了的话我再试试,不上线就算了,kimi也挺好的。唉。
1
CapNemo 7 小时 37 分钟前
有,但需要到 120k 左右出现
|
2
frantic 7 小时 36 分钟前
我由于抢不到 zhipu 的买的是 z.ai 的。
已知的问题: 1. 偶见代码编写甚至会漏大括号导致代码报错(很低端的错误) 2. 高端模型的并发过低,不能通过站起来蹬,见 https://www.v2ex.com/t/1204366#reply0 3. 经常 `The service may be temporarily overloaded, please try again later [retrying in 20s attempt #7]` 4. 很慢,感觉 claude opus 或者 GPT 5.4 5 分钟干完的活它要小半个小时,叠加问题 2 你有时候只能干等着 代码能力感觉还行,大概在 claude sonnet 4.6 和 opus 4.6 之间。 |
3
mikifuns OP @CapNemo 差不多,基本上就 100~140k 左右那样,最坏 80 多 k 也出现过,不过算是偶然复读半天了又圆回来了,大部分回答作废的情况都是 100k+的时候坠机
|
4
bleeontheway 7 小时 34 分钟前
经常遇到,而且是 80K 就比较容易碰到了,所以我一般会尽量控制上下文不超过 80K
遇到复读的情况通常都是 ESC 然后/rewind ,然后重来,基本上都会好 |
5
mikifuns OP @frantic 并发什么的 tpm 什么的我都无所谓了,能干好活就行,犯低级错误的话怕不是它编辑完回过头审查的时候就开始有点忘东西了(健忘症前兆怕不是)。不知道是算力不足还是真的就“不拘小节”...
|
6
mikifuns OP @bleeontheway 80k 对 vibecoding 感觉是不太能接受的... = =|| 碰到前后端交替着改逻辑的情况 128k 都危险
|
7
wat4me 7 小时 28 分钟前
现在的大模型上下文利用率就 50%,只有 Claude 好一点,70%多,上下文用多点就会有发癫的问题
|
8
kuviki 7 小时 17 分钟前
|
9
dalibaxiaoli191 7 小时 16 分钟前
我跟你用一样的套餐,用 openspec 做会好一点,一般我到 100 多 k 的时候就会手动 compact 一次
|
10
onedge 7 小时 15 分钟前
聪明,慢,卡
|
11
onedge 7 小时 11 分钟前
我是 Zai 的 Pro ,GLM5 ,你要走阿里百炼,很稳,也很聪明,帮我定位过很多 BUG 原因;
GLM 5.1 我用的 Zai 官方(目前只有官方),聪明,基本超过 SOnnet4.6 一点,速度问题不谈,没办法解决,上下文的问题你可以通过调整 cc 的配置 100000 的自动 compact: "CLAUDE_AUTO_BACKGROUND_TASKS": "1", "CLAUDE_CODE_AUTO_COMPACT_WINDOW": "90000", "CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS": "1", "DISABLE_NON_ESSENTIAL_MODEL_CALLS": "1", "ENABLE_TOOL_SEARCH": "true" 这几个变量全开,我更激进点,90000 就自动 compact ,这样体验会好很多,问题在于 compact 的多,整个流程会慢上加慢,但是不会断。 |
12
jojopro 7 小时 11 分钟前
腾讯用的是开源自己搭建的 glm-5 又不是官方自己调教的 肯定不一样啊
|
14
Sezxy 6 小时 39 分钟前
腾讯的思考死循环遇到,官方的倒好像没遇到过,现在官方的用 glm-5.1
|
15
PerFectTime 6 小时 36 分钟前
很垃圾,用的海外版。给他一个模块让他了解,使用计划模式提出修改意见,继续沟通方案的时候直接开始写了;另外写出来的东西幻觉太深了,项目里面没有的东西他一直在幻想,根本就跑步起来
|
16
andyskaura 6 小时 34 分钟前
我是去年便宜的老套餐,GLM5 基本无法使用。
倒不是模型质量问题,像是官方给老用户的排队权重很低,下午 90%概率跑不了需求。 |
17
shilianmlxg 6 小时 32 分钟前 via iPhone
@Sezxy #14 就是一直重复一段字符串,那大佬你是咋解决的呢?
|
18
pulutom40 6 小时 20 分钟前 via iPhone
我们公司买的企业版本,不限量使用。感觉还行吧,能用,但就是太慢了。也挺贵的,我一个人,一天干 400 500 块钱的 token
|
19
GopFei 6 小时 18 分钟前
用的阿里的 coding plan
glm-5 前端写的依托,连 kmini 2.5 都比不了。 后端也还可以,但是有时候让它改什么的时候,动都不动,瞎输出一堆东西。 |
20
mikifuns OP @pulutom40 公司付款版的不限量 XD 我们公司也用了智谱,看起来貌似也还行,但是我们公司不是拿来做开发所以实战上对 coding 影响不好判断
|
21
mikifuns OP @PerFectTime 是的,幻觉这个问题我很担心,输出乱码啥的还是“小白”能明显感知到的,但是如果幻觉的话不仔细看就让他胡诌了。我也是那天看,明明没用到 Google 的资源但是他输出说一个“GoogleXXX 的调用的完善”,后面又说什么销售啊购物车啥的(但是我就再做一个简单的旅行记事本),我才意识到他幻觉了,立即中断了幻想
|
22
PerFectTime 5 小时 55 分钟前
@mikifuns #21 建议你不要浪费时间在国内模型上,现在 gpt plus 开小号,站内有渠道是 15 块钱一个号一个月,可以搜索一下,囤 3 个号够你猛猛干了
|
23
mikifuns OP @PerFectTime 就 vibe 来说 25%用得到 GPT 的那种战力(所以我有一个 plus 号),但是剩下 75%都属于大部分正经程序员都会改但扔给小白就抓瞎的玩意。
所以才会需要 glm/kimi 一类的平替。如果是公家事也就算了,自己的 ,不赚钱,纯爱好,完了五十一百往里扔,gpt plus 那点额度问 4 轮 5 小时没了,6 轮下来周剩 75%,无法支撑。 就我这个月的花销,50 的火山 lite+腾讯 200Code+GPT120(下个月去🇹🇷订),300+的花销,hmmmm 。 钱毕竟不是刮来的。 |
24
mikifuns OP @PerFectTime 而且长期看 codex 这个玩法不可持续了,毕竟要转成什么 token 代币计费?最近几周... :( Team 车都开走了不是。
|
25
jqknono 5 小时 4 分钟前
|
26
hdfg159 4 小时 45 分钟前
现在明确告诉你,智谱家也会,还是经常出现
|
28
Sezxy 3 小时 57 分钟前 via Android
@shilianmlxg 停止任务后,再继续。
|
29
lyhiving 3 小时 44 分钟前
如果我说比之前的版本还差点你信不信,目前发现退步了
|
30
defaw 3 小时 24 分钟前
5-turbo 挺强的,gpt5 水平,知识面差点,思考能力是有的。
|
31
mikifuns OP |
32
PerFectTime 38 分钟前
@mikifuns #24 能用一天是一天不是, 再不济订阅正价 plus 会员也可以
|