• 请不要在回答技术问题时复制粘贴 AI 生成的内容
yaocy
V2EX  ›  程序员

真的没人觉得 codex 比 claude 笨很多吗?

  •  1
     
  •   yaocy · 2 days ago via Android · 10174 views

    甚至一些低级问题,比如一行注释不写,不知道自己生成单元测试,额外多写几个不必要的类出来,也不向我逐个确认要点

    76 replies    2026-07-04 23:52:08 +08:00
    linbenyi
        1
    linbenyi  
    PRO
       2 days ago
    可能也是定价的底气吧。
    allgy
        2
    allgy  
       2 days ago
    还行啊,约束条件给得多,codex 也能变 claude
    hengxiangbianhua
        3
    hengxiangbianhua  
       2 days ago via Android
    我也觉得 codex 不太行,现在各种模型价格差不了多少,能力确实天差地别
    billccn
        4
    billccn  
       2 days ago
    这两家同档次的模型实际能力差不多,但是系统提示词的优化方向不一样。建议你的偏好写到你的 AI 工具的自定义提示词里面。

    另外我记得两家的系统提示词都有避免向用户确认、尽量猜测用户意图的指示。这应该是想避免对话频繁中断浪费导致上下文被踢出缓存。你需要确认的话就自定义呗。
    banricho
        5
    banricho  
       2 days ago
    不觉得,持续优化项目的 AGENTS.md ,一次性把话说清楚最重要
    chengkai1853
        6
    chengkai1853  
       2 days ago   ❤️ 11
    和你感觉相反,Codex 比 Claude 细致太多了
    niubee1
        7
    niubee1  
       2 days ago   ❤️ 4
    感觉现在有些人动辄非 Claude 不能干活,我就怀疑你是搞什么外星科技呢,离开 Claude 你就是个瘸子了?不会干活了?
    lightryanking
        8
    lightryanking  
       2 days ago
    一起用 codex5.5 fable 都很好;

    谷歌 gemini 啥的就拉跨了
    yzw7489757
        9
    yzw7489757  
       2 days ago
    电油之争?别比谁最好,差的是使用习惯和姿势。

    相反,我觉得 codex 比 claude 更好操作,边界也相对可控。
    noahliaszn
        10
    noahliaszn  
       2 days ago   ❤️ 1
    都差不多 claude 爱说废话, codex 喜欢很快就开始干写一堆没用的 helper
    2 个一起用一个做 plan 一个做 execute
    lianyue
        11
    lianyue  
       2 days ago
    codex 很喜欢自己写代码 都不知道用依赖 不知道去找 github
    然后 代码 很乱真的很乱 功能文件 输入输出 接口等都不清晰 代码到处放
    连 cursor 的 auto 都不如 真的 结构性一点都不如他
    但是基础功没问题 缺调教 AGENTS.md 要约束的规则偏多很多
    AGENTS.md 写好
    我觉得边界会很清晰
    现在 我 AGENTS.md 强制了 4 个文档
    TESTING.md README.md FLOW.mmd AGENTS.md
    叫他动手之前有必看
    并且 前三个文档是必须的 改动了必须对齐 尤其是 flow.mmd 流程图 基本我 不看内部代码 只看流程图+ 输入输出接口 和输入输出约束就行了
    yzw7489757
        12
    yzw7489757  
       2 days ago
    楼上,一堆错别字...
    canyue7897
        13
    canyue7897  
       2 days ago
    跟楼主相反
    codex 是唯一一个能严格按照我的要求干完活儿的
    其余的或多或少都会偷懒
    ebushicao
        14
    ebushicao  
       2 days ago
    Codex 最近确实很笨,降智严重。不过一行注释不写不是什么问题吧,vibe coding 没注释更好吧,agent 自己去看代码比被注释带偏好多了
    kuhung
        15
    kuhung  
       2 days ago
    Codex 比较喜欢写防御性编程,生成一大堆假设。
    Cloudiver
        16
    Cloudiver  
       2 days ago
    @chengkai1853 同意,claude 虽然落地快,但 bug 很多。GPT 相对严谨、细心很多
    Jamieyang
        17
    Jamieyang  
       2 days ago
    Codex 不是蠢,是懒。比 Claude 更懒就用得更累
    zuosiruan
        18
    zuosiruan  
       2 days ago via iPhone
    @chengkai1853 +1 codex 很多时候考虑的比 claude 要好的多,尤其是和 opus4.8 比
    wolfie
        19
    wolfie  
       2 days ago
    gpt-5.4/5.5 指令依从度太差,而且经常丢上下文。
    PerFectTime
        20
    PerFectTime  
       2 days ago   ❤️ 3
    有什么好争的, 我觉得是人的问题
    little_cup
        21
    little_cup  
       2 days ago
    我的感受是,Codex 系列更适合于依据长文档进行开发; Claude 系列更适合许愿式开发。
    当然,Fable 5 确实是目前综合性能最强的。Codex 老爱写过度的防御式编程。但是同样价格,Codex 量实在多太多了。
    wonderfulcxm
        22
    wonderfulcxm  
       2 days ago via iPhone
    @lianyue codex 写代码不是项目决定的吗?相反,我觉得 codex 很爱参考代码,比如写一个 wordpress 插件,它会参考我之前写的插件,结构和代码风格保持高度一致。
    HappyAndSmile
        23
    HappyAndSmile  
       2 days ago
    codex 确实是比 Claude code 差很多的,只能通过建立自己的经验.md ,让它弥补自身的缺陷
    v2gba
        24
    v2gba  
       2 days ago
    opus 也傻逼

    只是 fable 暂时独一档而已 看看 5.6 吧
    fovecifer
        25
    fovecifer  
       2 days ago
    GPT5.5 目前写代码是性价比最高的
    Opus 比较适合做架构之类的工作
    KING754
        26
    KING754  
       2 days ago
    真的没有人用 cursor 吗?
    量大,各种模型可以随心所欲。
    可视化 UI ,操作简单。
    zhuang0718
        27
    zhuang0718  
       2 days ago
    主要是最近降智的原因吧
    noqwerty
        28
    noqwerty  
       2 days ago   ❤️ 5
    叽里咕噜说啥呢,反正都比我聪明多了
    ifconfig
        29
    ifconfig  
       2 days ago
    codex:现在重跑同一个 suite ,看 10 个测试是否全部通过,尤其是刚才红的那条
    DefoliationM
        30
    DefoliationM  
       2 days ago via Android
    不觉得,挺好用的,不过写前端不咋地,后端完全按照我的要求来。
    1874w
        31
    1874w  
       2 days ago   ❤️ 4
    我个人觉得大部分是人的问题.

    如果始终是许愿式开发.评价体系为 AI 能一次猜到你想的 = 聪明,猜不到 = 不聪明

    那任何模型应该都存在这个问题,除非他能接你的脑机接口,知道你脑子里的全部上下文

    而且由于变量的不同,会有一些可能存在的错误判断.

    比如在 Claude 中聊问题 A, 发现他能很快明白你的描述,解决你的问题.

    后面 换到到 Codex 时,聊的是问题 B,但是他没能立马明白你的描述,得聊多轮才能解决你的问题

    所以得出的结论: Claude 比 Codex 聪明.或者 Codex 降智严重

    但实际上有可能同样的提示词放到 Claude 中也未必能立马解决问题 B

    ==========================================================

    所以我个人感觉许愿式开发,总的来说是不稳定的,除了模型本身的能力是一个影响因素外,一个相对稳定的工作流是很重要的, 最重要的就是得让 AI 知道你当前问题的足够上下文.

    理论来说用能力相对低一些的模型 + 稳定工作流 也能解决你的问题.

    superpowers 的 Brainstorming SKILL 本身的设计理念,就大概是这个意思. 当然毕竟它比较重和费 Token,不是所有问题都得用 superpowers 来解决.

    所以 AGENTS.md/CLAUDE.md 和一些你本地的文档,都是非常重要的上下文.

    我日常使用时,基本都会让 AI 把稳定的流程固定成本地文档.

    例如和他聊完当前项目是怎么部署的,怎么修 bug 的,项目的架构等等文档,都可以在聊完之后让他沉淀成固定文档.下次让他读这些文档就知道怎么开始了.

    之前在 X 上也看到一个方法论:

    在和 AI 聊完和并改完 BUG 之后,可以再最后问 AI 一句: 如果回到一开始,我该怎么和你描述,你才能一次性解决这个问题

    感觉可以试试,也能学习到该如何和 AI 进行交流
    germain
        32
    germain  
       2 days ago   ❤️ 2
    这个行业已经从单纯的歧视印度程序员沦落到了歧视 Codex 了。很多人都不曾问过自己,如果现在失业去面试,自己在面试桌上是个什么样的角色。
    1874w
        33
    1874w  
       2 days ago
    @1874w 如果这些本地文档不想提交到远端仓库 或者 污染提交历史,可以参考我的这篇博客来设置 git 忽略

    这样 Vibe Coing 过程中产生的项目本地文档, 甚至可以放更多私人流程和信息,而不用考虑会被 AI 提交到远端仓库


    https://blog.1874.cool/vibe-coding-mid-doc
    1874w
        34
    1874w  
       2 days ago
    @little_cup 我感觉 你可以总结下他的 过度的防御式编程 规则,然后把不想要的规则写进本地文档,然后在一开始聊天时让他读一下,放到上下文应该能解决一部分
    Yasuke
        35
    Yasuke  
       2 days ago
    反正我两个都用,codex 比 cc 好多了,就是 codex 写 ui 简直让人眼前一黑
    nVic
        36
    nVic  
       2 days ago
    他俩严格来说不是一类工具。
    coreJK
        37
    coreJK  
       2 days ago
    @KING754 #26 之前用得多,但是 cursor 动不动就没响应了
    mywind
        38
    mywind  
       2 days ago
    我感觉可能和上下文信息有关,如果一个工具用久了,积累了相对多的上下文信息,用起来就会顺手很多,这时候再用另一个就会感觉不太顺手。
    我个人用 Codex 多一下,个人的感受 Codex 相对细致,但也更循规蹈矩,Claude 对一些开放性问题会相对有洞察一些,但是也喜欢自嗨。两个都不能突破使用者本身能力的上限,会逐渐适配出一套看着好像是那么回事并且讨喜的回答模式。
    Meteora626
        39
    Meteora626  
       2 days ago
    codex 上下文管理一绝好吧,远程压缩一个上下文记录好多东西 和大模型压缩一个天一个地
    nebulabox
        40
    nebulabox  
       2 days ago
    和你感觉相反,Codex 比 Claude 好用
    potatowish
        41
    potatowish  
       2 days ago via iPhone
    codex 就是缺少一点灵性。写代码比较死板,严谨过头,它甚至改个注释都要给我重新编译一遍。
    houOne
        42
    houOne  
       2 days ago
    codex 比我聪明很多,就挺好的。 我也想用 claude 用不上~
    NASK
        43
    NASK  
       2 days ago
    首先确认一下你的 codex 推理等级是不是 xhigh
    Mandelo
        44
    Mandelo  
       2 days ago   ❤️ 1
    但是奥特曼不封号
    Bluecoda
        45
    Bluecoda  
       2 days ago
    并没有,只要 context 足够小,足够窄,并不觉得 codex 比 cc 差多少
    malatang
        46
    malatang  
       2 days ago
    没有啊
    hengxiangbianhua
        47
    hengxiangbianhua  
       2 days ago via Android
    @NASK 我觉得 xhigh 反而不好
    rb6221
        48
    rb6221  
       2 days ago
    都别吵了,大家一样烂,要我说最强的还得是古法编程[doge]
    NullIsLife
        49
    NullIsLife  
    PRO
       2 days ago
    能畅饮 cc 的会用 codex 吗
    clemente
        50
    clemente  
       2 days ago
    @NullIsLife 我都用啊
    lovelyidiot
        51
    lovelyidiot  
       2 days ago
    codex 65 分,claude 75 分,差不多就这样。前者比一半以上人强,后者比 3/4 以上人强。65 分就是有经验、能做,做的也就那样,没新意。75 分就是能做,明显比大部分人做的更好,但做不了 85 分人能做到的程度。
    bojue
        52
    bojue  
       2 days ago
    @lightryanking 北美豆包
    keenkiller
        53
    keenkiller  
       2 days ago via Android
    codex 确实不写注释,你要跟他说他才会补
    fatigue
        54
    fatigue  
       2 days ago
    恰恰相反,claude 一个对话刚开始还好,用着用着就开始退化,最后会困在某个点死活出不来,codex 整体性要好很多,很少会卡住
    Isuxiz
        55
    Isuxiz  
       2 days ago
    codex 现在有个 bug ,症状是固定 516 reasoning token ,体验就是模型降智很厉害
    https://github.com/openai/codex/issues/30364
    等修复吧
    ooppstef
        56
    ooppstef  
       1 day ago
    我的天?居然会有人觉得 claude 比 gpt 强? 推理能力完全不在一个层级好吧。。。疯了,当然 gpt 的前端能力很弱,这个 gpt 自己也承认,但推理,review ,找 bug ,写代码的严谨性,把 claude 吊起来打啊。


    不过降智了,就没什么好聊的。。。
    NullIsLife
        57
    NullIsLife  
    PRO
       1 day ago
    @clemente #50 能说说在畅饮 cc 的情况下,什么场景你会想用 codex
    diaoyulao
        58
    diaoyulao  
       1 day ago
    两个都在用,Claude code 适合当军师,Codex 适合干苦力,一个出谋划策做监工,一个猛猛干
    xidaduo
        59
    xidaduo  
       1 day ago
    Claude 在出方案和产品思路方面比 Codex 好太多,Codex 干有详细文档和计划的活比较稳定,在执行层面比较靠谱。一个胜在创新想法,一个胜在干活稳定、使用也更稳定
    MuyuQ
        60
    MuyuQ  
       1 day ago
    我的 codex 会写一大堆单元测试。。有时候我不得不中断他的任务,告诉他别写那么多,费的是我的 token 。
    smileeast
        61
    smileeast  
       1 day ago
    @1874w #31 superpowers 这个太费 token 了,我现在用 https://github.com/mattpocock/skills 这个 skill ,这个 skill 的一个 grill-me 就是解决沟通的问题。如果能和 AI 能把事情沟通明白了,那么人际沟通这一块也会强很多。我们想的>我们表达的>对方想的>对方执行,这是四个层级,很多人想的是直接从我想的就变成执行层,这明显是有问题的。
    elevioux
        62
    elevioux  
       1 day ago
    你们拿到就用的吗?没有全局的 agents.md ?我都是写了一堆约束的。例如,写 docblock ,不要兜底,需求要反复确认后给出计划。

    虽然还是时不时会抽风,但要比不加约束好很多。
    1874w
        63
    1874w  
       1 day ago
    @smileeast 可以,我试试你这个。我目前 Token 比较充足,所以还在用,只不过很少用它来走完整流程。
    Jamieyang
        64
    Jamieyang  
       1 day ago
    个人感觉

    智商:GPT > Claude
    写代码: GPT > Claude
    Review: GPT > Claude
    灵性:Claude > GPT
    业务理解/认知:Claude > GPT
    运维能力:Claude > GPT

    只能说各有长处,使用场景不一样。GPT 合适纯后端,Claude 合适 DevOps 这种跨界工种
    x4gz
        65
    x4gz  
       1 day ago
    他们写不出来原因主要是我的提示词不够细致
    结论:我最笨
    yooomu
        66
    yooomu  
       1 day ago
    claude 考虑事情没有 codex 全面,经常丢三落四。只要需求描述清楚,codex 几乎不会返工,测都不用测。claude 适合不清楚怎么做的时候进行需求发散
    ximaoyang
        67
    ximaoyang  
       1 day ago
    codex 确实很笨,目前智能水平 claude code > deepseek > codex
    deplives
        68
    deplives  
       1 day ago
    claude 才是一坨,俩月前 opus4.8 /simplify 把原本至少能编译通过的 swift 代码改的乱七八糟,编译都失败,最后好不容易编译过了,app 启动就 crash 最后 5h 用完了也没给修好
    codex 5.5 用了一次对话就找到原因并且修复了,然后第二个月就退订了 claude 订阅了 codex 5x
    techmale
        69
    techmale  
       1 day ago via iPhone
    Skill Issue (pun intended
    imdoge
        70
    imdoge  
       1 day ago
    复杂的 codex 做的更细(虽然也有冗余设计风险)
    不降智来说,大概就是 opus4.8 是高考 660 分但做事不够全如果你的代码很屎山各种耦合很多,他可能不看够全,gpt5.5 是高考 650 分但肯给你花半小时认真全面做一件事
    009694
        71
    009694  
       1 day ago via iPhone
    看吧。这就是为什么老板都觉得是员工有问题,从来不考虑是不是自己没想明白说明白
    isbase
        72
    isbase  
    PRO
       1 day ago
    最近降智了
    Ryanzlab
        73
    Ryanzlab  
       1 day ago
    @009694 优秀的模型是不需要你说废话的,还会纠正你的问题。。AI 早期才是需要堆砌优秀的提示词来实现还能说得过去的效果
    Had
        74
    Had  
    PRO
       1 day ago
    我反而觉得 CC 注释实在是太罗嗦了,明明代码说的那么明显,还要再堆个几行注释出来
    twk93
        75
    twk93  
    PRO
       1 day ago via iPhone
    还行吧,感觉差距不大
    009694
        76
    009694  
       13h 53m ago via iPhone
    @Ryanzlab “优秀的员工是不需要多说废话的” 这个你听起来熟悉吗
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2762 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 374ms · UTC 05:45 · PVG 13:45 · LAX 22:45 · JFK 01:45
    ♥ Do have faith in what you're doing.