先抛个砖:GLM5.1 > deepseek v4 > minimax2.7 ≥ mimo v2.5 ≈ kimi2.6
以一个案例来分析这几个的能力:帮我生成一个天气查询H5应用 提示词就这一句,都一样。
glm5.1: https://imgchr.com/i/pehcWCR 天气温度假
kimi2.6:https://imgchr.com/i/pehczKf 天气温度真
minimax2.7:https://imgchr.com/i/pehcBvV 拉完了
mino v2.5 : 第一遍没有给我生成,换提示词:帮我开发一个天气查询H5应用。才继续生成:https://imgchr.com/i/pehgQIJ 天气温度假。 有一个背景下雨的效果
deepseek v4: https://imgchr.com/i/pehcgUJ 温度真
仅针对这个案例的评价:glm5.1,kimi2.6 可以, deepseek v4 ,mino v2.5 次之。 minimax2.7 什么玩意?
大家也可以自己测试下。
1
canyue7897 16h 43m ago via iPhone 我觉得 kimi 还可以哈?
没想到这么拉? |
2
onedge 16h 36m ago
GLM 5.1 > DS v4 = Kimi 2.6 > mimo v2.5 > minimax 2.7
|
3
cookii 16h 34m ago via Android minimax 不配上榜好吧,夸张点说 4B 模型水平
|
5
uqf0663 16h 23m ago
kimi 我会继续订阅,但是 minimax 就算了,订阅完用了三天我就放弃了,不会再考虑使用。
|
7
ayasealter570 16h 12m ago
minimax 官方订阅的极速版,智力低到没边了
|
8
huaweii 16h 10m ago via Android
@ayasealter570 有没有例子看看,好奇
|
10
junwind OP @canyue7897 实测的这个案例,kimi 还行,不过生成是很慢的
|
11
junwind OP @canyue7897 kimi 不拉,是我个人的武断,实测后还不错
|
12
drealism 15h 53m ago via Android
可以把 qwen 系列补一个进去么🤜🤛
|
13
ebushicao 14h 25m ago
每次有人说跑分能够说明能力,我就会举出 minimax2.7 这个例子,那真是连 skill 和 tool 都不一定会调用,某些时候我本地部署的 qwen3.5 9b 都比它强。
|
14
aes114514gcm 14h 19m ago
和我的体感比较接近,glm5.1 略强于 kimi2.6 ,
|
15
zenfsharp 14h 14m ago GLM5.1 > deepseek v4 > 其他,起码到这里是同意的。
我刚开了 opencode 的 Go 订阅,在 opencode-cli 里使用同样的 skill 、MCP 、Agent.md ,问 GLM 我项目里的一个业务逻辑,直接一次性揪出来了,而 DS 没有,反复提示了三次才找到。 |
16
zenfsharp 14h 13m ago
不知道各种公众号是有任务还是怎么回事,一个劲的鼓吹 deepseek v4 ,跟实际体验严重背离。
|
17
lukaktus6768 13h 41m ago
看到 glm 我就要踩一脚,买谁都不要买他
|
18
anmie 13h 35m ago @zenfsharp 自媒体不这么写没人看啊, 但是你看 Deepseek 官方就实在多了,官方在公众号里,明确说了模型在某些方面比 xx 模型要弱,而不是无脑鼓吹遥遥领先。
这么说把,做信息分享类的自媒体,有一个算一个,肯定会夹带私货,在我看来,有一个算一个都是傻逼。 而看自媒体说的就深信不疑的人也是傻逼。 我自始至终,从大模型刚能聊天,到现在 agentic ,Deepseek 虽然不是最强的那个,但是一直都是我的主力,不为别的,我坚定的站在这样一个不焦虑,不浮躁的人和公司这边。(而 minimax 我根本试都没试过,不感兴趣。) |
19
metalvest 13h 33m ago
GLM5.1 天气温度假,为什么排第一?
|
20
weilongs 13h 20m ago
minimax2.7 排不到那个位置.
|
21
Desiree 13h 20m ago
暂时只用过 Glm 跟 minimax2.7 挺垃圾的,glm 勉强能用,但是比 cc 跟 codex 还是差一大截,minimax2.7 是完全不能用
|
22
zzz123456qqq 13h 4m ago
啊
|
23
richardwong 12h 15m ago
GLM5.1 不支持多模态挺难受的
|
24
owt5008137 11h 16m ago via Android
@richardwong 官方送的视觉识别 mcp 可以勉强顶一顶。
|
25
Azmeont 11h 1m ago
GLM5.1 和 DSv4-Pro 体感都比 opus4.6 强,但 DSv4 胜在 1M 上下文
|
26
issakchill 10h 49m ago
看到 minimax 不上桌就放心了
|
27
Lighfer 10h 35m ago
不测一下 qwen3.6 27b 吗?据说编程能力也也很强?
|
28
xiaomushen 10h 28m ago
基本同意,今天高强度用 DeepSeek V4 Pro
|
29
xiangqiankan 10h 27m ago deepseekv4 只是编码方面的后训练不足,架构设计上这是唯一的真神,理论上是开源模型的天花板
|
30
mingtdlb 9h 6m ago
GLM 是写代码比较强吗?我感觉他 chat 有点拉
|
31
iamzz 52 mins ago
难兄难弟。
|
32
shuiduoduo 50 mins ago via iPhone
和 claude4.7 对比一下呢
|
33
passion336699 25 mins ago
minimax 不做评价...
|
34
lizhesystem 12 mins ago
minimax 确实拉,不在一桌,不过周末使用了 DeepSeekV4 Pro 确实超乎预期,如果暂时没有好用的模型我会优先选择用它。
|