V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
tlerbao
V2EX  ›  程序员

抛开性价比这个选项,你认为目前写代码最强模型是?

  •  
  •   tlerbao · 7 小时 58 分钟前 · 2263 次点击

    答案无疑肯定是在 Codex 和 Claude Sonnet/Opus 中产生。

    为什么要抛开性价比这个选项?

    我发现现在甚至有人还在吹 Deepseek 、GLM 。

    2025 年了,哪吒票房那段时间还没完?年还没过完?

    吹的有两种人(我说的比较难听):

    1. 用不起贵的,强行拉出性价比,所谓的便宜好用。
    2. 爱国,大谈 Claude 敌对势力。

    所以,你认为

    抛开爱国情绪、抛开花费,目前写代码最强模型到底是 Codex 还是 Claude ?

    没深度使用过多家的,没对比过的,只用过某一种的,回答也基本没有什么参考价值。

    46 条回复    2025-10-03 19:43:07 +08:00
    mooyo
        1
    mooyo  
       7 小时 54 分钟前 via iPhone   ❤️ 1
    claude-sonnet-4.5
    imjiaoyuan
        2
    imjiaoyuan  
       7 小时 45 分钟前 via Android
    claude-sonnet-4.5


    和这个比起来国产的像低能儿
    TimePPT
        3
    TimePPT  
    PRO
       7 小时 42 分钟前 via Android   ❤️ 1
    GPT-5 High
    ty29022
        4
    ty29022  
       7 小时 20 分钟前 via iPhone   ❤️ 1
    我个人的感觉是 gpt5 像个 cs 科班的大佬
    claude 像个经验丰富的中级程序员 对复杂情况无能为力
    novaren
        5
    novaren  
       7 小时 15 分钟前 via Android
    claude 毋容置疑
    facebook47
        6
    facebook47  
       7 小时 12 分钟前 via Android   ❤️ 4
    Claude 写代码无敌,另外在这个论坛,头一次听说有人吹 deepseek 的,一拉一踩非常不可取
    spike0100
        7
    spike0100  
       6 小时 57 分钟前 via iPhone
    我自己用下来 glm 其实还好。主要差别是 claude sonnect 4.5 一般一次生成的代码直接就可以跑,glm 需要主动提醒一两次才能调好。最终效果感觉差别不大。
    spike0100
        8
    spike0100  
       6 小时 55 分钟前 via iPhone
    @spike0100 都是用 claude code + 对应基础模型测的。deepseek 和 qwen3 max 试过跑了 50 ,60 人民币的 token ,结果都没法看。
    takanashisakura
        9
    takanashisakura  
       6 小时 52 分钟前   ❤️ 1
    说性能的话毋庸置疑吧。但是在真正用的时候,很难不考虑性价比和可用性吧。
    所以我也没得选,只有 deepseek 和 gemini 。
    xiaojie668329
        10
    xiaojie668329  
       6 小时 20 分钟前
    有时候 Gemini 做得比 Claude 好
    raydg7777
        11
    raydg7777  
       6 小时 18 分钟前
    还是 Codex
    Alias4ck
        12
    Alias4ck  
       6 小时 15 分钟前   ❤️ 1
    吹 glm 的和 deepseek 的 肯定是没吃过细糠
    victor
        13
    victor  
       6 小时 14 分钟前
    claude 够快所以是主力。但 claude 4.5 写完的功能,codex 还能挑出来一堆毛病。
    skiy
        14
    skiy  
       6 小时 14 分钟前   ❤️ 4
    你抛开花费但抛开不了人家不让你用吧?这是不可控因素。刚刚又有 up 说自己被封号了。
    yb2313
        15
    yb2313  
       6 小时 9 分钟前
    抛开花费我选同时使用几个顶尖模型,然后每次需求选择最好的一个结果,即使不同时使用也可不断轮换使用对比每个模型擅长领域。
    lithiumii
        16
    lithiumii  
       6 小时 8 分钟前 via Android
    可能有一个月没写代码了,之前是用免费的 copilot 里的旧版本 gpt (好像是 4.1 )和 Claude ( 3.5 吧大概)或者用 Aider 调免费的 Gemini 2.5 Pro ,或者付费的 DeepSeek V3 或者 3.1 和 GLM 4.5 (这俩便宜)。
    体感最强是 Gemini 2.5 Pro ,其次相差不远是 DS 和 GLM ,免费 copilot 送的模型是真的不行了。
    haiku
        17
    haiku  
       6 小时 3 分钟前 via Android   ❤️ 1
    GPT 5 high
    下个月等 Gemini 3
    streamrx
        18
    streamrx  
       6 小时 2 分钟前 via iPhone
    gpt5 high
    zpvip
        19
    zpvip  
       6 小时 0 分钟前
    claude-sonnet-4.5
    这个是毒品, 不能碰
    Imindzzz
        20
    Imindzzz  
       5 小时 47 分钟前 via Android   ❤️ 8
    你想抛开谈就抛开谈呗,为啥要贬低一下“吹”deepseek...
    mywjyw
        21
    mywjyw  
       5 小时 31 分钟前
    codex cli 做的比 claude code 差,很多功能不全,很难用
    lancevps
        22
    lancevps  
       5 小时 30 分钟前
    生成 html 的 UI 设计稿,豆包最强
    sunnysab
        23
    sunnysab  
       5 小时 26 分钟前
    额,倒也不是爱国情绪,https://www.reddit.com/r/LocalLLaMA/

    reddit 上很多外国人考虑中国的模型,超级积极… qwen 和 glm 评价不错。llama 挨骂较多,openai 被骂的也不少
    Thymolblue
        24
    Thymolblue  
       5 小时 18 分钟前
    现在用 GPT-5 和 Claude 有什么渠道吗?直接用 API 都需要组织认证,目前国内身份没法通过
    yyws2012
        25
    yyws2012  
       5 小时 14 分钟前 via Android
    @mooyo 都不考虑价格了还 sonnet
    yyws2012
        26
    yyws2012  
       5 小时 13 分钟前 via Android
    @skiy 可以买别人转接的,就是 opus 会非常贵,但既然不考虑价格那就是可以的
    ggp1ot2
        27
    ggp1ot2  
       5 小时 9 分钟前
    Claude Sonnet 4.5

    没有什么价格不价格的,这个模型可以满足我现在的需求
    mooyo
        28
    mooyo  
       5 小时 2 分钟前
    @yyws2012 #25 sonnet 4.5 现在就是比 opus 4.1 好用啊。有又快又好用的为啥要用又慢又垃圾的
    charles0
        29
    charles0  
       5 小时 1 分钟前
    GPT-5 high (比 GPT-5-Codex 强很多)
    Bad0Guy
        30
    Bad0Guy  
       4 小时 56 分钟前
    cc ,但是封号比 codex 还疯狂,如果 Gemini3 效果比 Claude4.5 好那我会考虑日常转用 Gemini3
    Gekou
        31
    Gekou  
       4 小时 46 分钟前
    没用过 claude ,但 claude 肯定不能一次处理 100w 的 token ,10w 行代码
    反驳请给出详细方法谢谢
    plasticman64
        32
    plasticman64  
       4 小时 46 分钟前
    claude 会找 bug ,这是我最佩服的一点
    v20220522
        33
    v20220522  
       4 小时 8 分钟前
    @charles0 为什么会这样, 能展开讲讲吗?
    lcandy
        34
    lcandy  
       3 小时 53 分钟前
    @TimePPT 支持,codex-high 都没 5-high 好用
    agagega
        35
    agagega  
       3 小时 41 分钟前 via iPhone   ❤️ 3
    为了那点所谓的优势整天琢磨哪个模型在 benchmark 里表现更好真的有意思么,还不如找到一个坚持用下去。有 gemini 用 gemini ,没有用 deepseek-v3 也能达到目的。天天炒作 claude 看着都麻了,是不是公司的政治观点还会影响用户?
    jonty
        36
    jonty  
       3 小时 33 分钟前
    2025 年了,还有人在对比最强模型?谁不知道 claude 好用,是大家不想用吗?
    rubyacgn
        37
    rubyacgn  
       3 小时 10 分钟前
    谁没事国庆写代码啊
    binaryify
        38
    binaryify  
       2 小时 38 分钟前
    Codex 虽然有点慢但是经常一步到位, claude 像是应届生,着急写代码,但是经常返工
    bytesfold
        39
    bytesfold  
       2 小时 5 分钟前 via iPhone
    Claude 4.5 体感跟 Codex 效果区别不大了;
    Claude 4 体感就是愣头青
    asuka02
        40
    asuka02  
       1 小时 33 分钟前 via Android
    你这是从抖音学的标题吗?
    zy5a59
        41
    zy5a59  
    PRO
       1 小时 11 分钟前
    我感觉这两个是互补的,codex 写逻辑强一些,但是 UI 写出来是真丑,claude 正好相反
    xuhuanzy
        42
    xuhuanzy  
       1 小时 4 分钟前 via Android
    codex 上下文读取很激进,对于复杂项目效果远超 claude
    Bluecoda
        43
    Bluecoda  
       57 分钟前
    claude-sonnet-4.5 用下来比 gpt5-high 强多了,速度又快,体验感太棒
    kennylam777
        44
    kennylam777  
       38 分钟前
    @sunnysab Local AI 來講中國的開放 LLM 的確不錯, 但私有商業 SOTA(只賣 API 那種)模型比還是比中國模型強
    welcomezhangjun
        45
    welcomezhangjun  
       15 分钟前
    claude-sonnet-4.5
    coderlxm
        46
    coderlxm  
       4 分钟前 via Android
    codex-gpt5-high
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1998 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 11:47 · PVG 19:47 · LAX 04:47 · JFK 07:47
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.