V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
junwind
V2EX  ›  程序员

glm5.1, kimi2.6, minimax2.7, mimo v2.5, deepseek v4,编程能力上的排名如何?

  •  
  •   junwind · 17h 47m ago · 3439 views

    先抛个砖:GLM5.1 > deepseek v4 > minimax2.7 ≥ mimo v2.5 ≈ kimi2.6

    Supplement 1  ·  15h 58m ago

    以一个案例来分析这几个的能力:帮我生成一个天气查询H5应用 提示词就这一句,都一样。

    glm5.1: https://imgchr.com/i/pehcWCR 天气温度假

    kimi2.6:https://imgchr.com/i/pehczKf 天气温度真

    minimax2.7:https://imgchr.com/i/pehcBvV 拉完了

    mino v2.5 : 第一遍没有给我生成,换提示词:帮我开发一个天气查询H5应用。才继续生成:https://imgchr.com/i/pehgQIJ 天气温度假。 有一个背景下雨的效果

    deepseek v4: https://imgchr.com/i/pehcgUJ 温度真

    仅针对这个案例的评价:glm5.1,kimi2.6 可以, deepseek v4 ,mino v2.5 次之。 minimax2.7 什么玩意?

    大家也可以自己测试下。

    Supplement 2  ·  15h 54m ago
    根据案例实测,纠正我之前的排名:glm5.7 >= kimi2.6 >= deepseek v4 > mimo v2.5
    附:minimax 不配上桌。
    Supplement 4  ·  15h 25m ago
    接评论区的要求,增加 qwen
    Qwen3.5 : https://pic1.imgdb.cn/item/69eddd196dcdaf678a8bc75c.png 和 minimax 一样,拉。
    Qwen3.6-plus: https://pic1.imgdb.cn/item/69edddbc6dcdaf678a8bc7d4.png
    Qwen3-coder 模式: https://pic1.imgdb.cn/item/69eddeb36dcdaf678a8bc93c.png
    这次的案例实测,都是用的官网的网页版,使用最新的模型测试。

    其它的模型,大家感兴趣的,可以自己测试一下。

    总结:国产模型第一梯队 glm ,kimi ,第二梯队:deepseek ,mimo , 第三梯队:qwen ,minimax 。
    34 replies    2026-04-27 09:00:36 +08:00
    canyue7897
        1
    canyue7897  
       16h 43m ago via iPhone   ❤️ 1
    我觉得 kimi 还可以哈?
    没想到这么拉?
    onedge
        2
    onedge  
       16h 36m ago
    GLM 5.1 > DS v4 = Kimi 2.6 > mimo v2.5 > minimax 2.7
    cookii
        3
    cookii  
       16h 34m ago via Android   ❤️ 1
    minimax 不配上榜好吧,夸张点说 4B 模型水平
    BestEicky
        4
    BestEicky  
       16h 25m ago   ❤️ 1
    @cookii 说是 4B 模型都抬举它了,应该是 SB 模型水平吧
    uqf0663
        5
    uqf0663  
       16h 23m ago
    kimi 我会继续订阅,但是 minimax 就算了,订阅完用了三天我就放弃了,不会再考虑使用。
    onedge
        6
    onedge  
       16h 17m ago
    @uqf0663 minimax 已经完全龙虾了,m2.5 刚出我还觉得能力可以的,2.7 真的废了
    ayasealter570
        7
    ayasealter570  
       16h 12m ago
    minimax 官方订阅的极速版,智力低到没边了
    huaweii
        8
    huaweii  
       16h 10m ago via Android
    @ayasealter570 有没有例子看看,好奇
    uqf0663
        9
    uqf0663  
       16h 1m ago
    @onedge 我就是用这龙虾的,m2.7 真的是连应付龙虾基本运行都有坑,目前我的龙虾只有 k2.6 勉强马马虎虎能凑合用。
    junwind
        10
    junwind  
    OP
       15h 57m ago
    @canyue7897 实测的这个案例,kimi 还行,不过生成是很慢的
    junwind
        11
    junwind  
    OP
       15h 54m ago
    @canyue7897 kimi 不拉,是我个人的武断,实测后还不错
    drealism
        12
    drealism  
       15h 53m ago via Android
    可以把 qwen 系列补一个进去么🤜🤛
    ebushicao
        13
    ebushicao  
       14h 25m ago
    每次有人说跑分能够说明能力,我就会举出 minimax2.7 这个例子,那真是连 skill 和 tool 都不一定会调用,某些时候我本地部署的 qwen3.5 9b 都比它强。
    aes114514gcm
        14
    aes114514gcm  
       14h 19m ago
    和我的体感比较接近,glm5.1 略强于 kimi2.6 ,
    zenfsharp
        15
    zenfsharp  
       14h 14m ago   ❤️ 1
    GLM5.1 > deepseek v4 > 其他,起码到这里是同意的。
    我刚开了 opencode 的 Go 订阅,在 opencode-cli 里使用同样的 skill 、MCP 、Agent.md ,问 GLM 我项目里的一个业务逻辑,直接一次性揪出来了,而 DS 没有,反复提示了三次才找到。
    zenfsharp
        16
    zenfsharp  
       14h 13m ago
    不知道各种公众号是有任务还是怎么回事,一个劲的鼓吹 deepseek v4 ,跟实际体验严重背离。
    lukaktus6768
        17
    lukaktus6768  
       13h 41m ago
    看到 glm 我就要踩一脚,买谁都不要买他
    anmie
        18
    anmie  
       13h 35m ago   ❤️ 3
    @zenfsharp 自媒体不这么写没人看啊, 但是你看 Deepseek 官方就实在多了,官方在公众号里,明确说了模型在某些方面比 xx 模型要弱,而不是无脑鼓吹遥遥领先。
    这么说把,做信息分享类的自媒体,有一个算一个,肯定会夹带私货,在我看来,有一个算一个都是傻逼。 而看自媒体说的就深信不疑的人也是傻逼。

    我自始至终,从大模型刚能聊天,到现在 agentic ,Deepseek 虽然不是最强的那个,但是一直都是我的主力,不为别的,我坚定的站在这样一个不焦虑,不浮躁的人和公司这边。(而 minimax 我根本试都没试过,不感兴趣。)
    metalvest
        19
    metalvest  
       13h 33m ago
    GLM5.1 天气温度假,为什么排第一?
    weilongs
        20
    weilongs  
       13h 20m ago
    minimax2.7 排不到那个位置.
    Desiree
        21
    Desiree  
       13h 20m ago
    暂时只用过 Glm 跟 minimax2.7 挺垃圾的,glm 勉强能用,但是比 cc 跟 codex 还是差一大截,minimax2.7 是完全不能用
    zzz123456qqq
        22
    zzz123456qqq  
       13h 4m ago
    richardwong
        23
    richardwong  
       12h 15m ago
    GLM5.1 不支持多模态挺难受的
    owt5008137
        24
    owt5008137  
       11h 16m ago via Android
    @richardwong 官方送的视觉识别 mcp 可以勉强顶一顶。
    Azmeont
        25
    Azmeont  
       11h 1m ago
    GLM5.1 和 DSv4-Pro 体感都比 opus4.6 强,但 DSv4 胜在 1M 上下文
    issakchill
        26
    issakchill  
       10h 49m ago
    看到 minimax 不上桌就放心了
    Lighfer
        27
    Lighfer  
       10h 35m ago
    不测一下 qwen3.6 27b 吗?据说编程能力也也很强?
    xiaomushen
        28
    xiaomushen  
       10h 28m ago
    基本同意,今天高强度用 DeepSeek V4 Pro
    xiangqiankan
        29
    xiangqiankan  
       10h 27m ago   ❤️ 1
    deepseekv4 只是编码方面的后训练不足,架构设计上这是唯一的真神,理论上是开源模型的天花板
    mingtdlb
        30
    mingtdlb  
       9h 6m ago
    GLM 是写代码比较强吗?我感觉他 chat 有点拉
    iamzz
        31
    iamzz  
       52 mins ago
    难兄难弟。
    shuiduoduo
        32
    shuiduoduo  
       50 mins ago via iPhone
    和 claude4.7 对比一下呢
    passion336699
        33
    passion336699  
       25 mins ago
    minimax 不做评价...
    lizhesystem
        34
    lizhesystem  
       12 mins ago
    minimax 确实拉,不在一桌,不过周末使用了 DeepSeekV4 Pro 确实超乎预期,如果暂时没有好用的模型我会优先选择用它。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5063 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 108ms · UTC 01:12 · PVG 09:12 · LAX 18:12 · JFK 21:12
    ♥ Do have faith in what you're doing.