V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
cellsyx
V2EX  ›  程序员

GPT-5.3-Codex 简单测试

  •  
  •   cellsyx · 1 天前 · 1462 次点击

    最近想试一下新款模型的能力, 于是打算用全自动模式写个 VScode codex 账号切换插件.

    在从来没有写过 VSCode extension 的前提下, 全程用 GPT-5.3-Codex Extra High, 从写文档开始总共花了大概 6 小时完成了一个能用的原型. 项目有效代码行数大约 3300 行(不包括文档和 AI Rules 等文件). 消耗的 codex 用量大约是 Business 订阅的 weekly 总量的 20%. 网页端 ChatGPT 5.2 Pro 的对话次数倒是很金贵, 大概一个月使用不超过 20 轮的样子.

    根据用户给出的项目需求描述和大致设计的 prompt, ChatGPT 5.2 Pro (Extended) 给出的详细设计实施方案以及各个 Phase 的执行 prompt 的质量不错, 就是 thinking 等待时间较长, 生成初步方案花了 30 分钟. 后面根据第一轮的方案细化需求(登录时自动更新用户 auth 文件, 用量统计, 自动刷新等)生成第二版方案(Standard)差不多也要等 20 多分钟. 总计 3 轮对话完成最终的方案设计.

    虽然项目很小, 原理也简单(auth.json), 但是编码全程只需要按各个 Phase 的 prompt 输入,一路自动执行, 每个 Phase 执行完提交一次. 遇到过一次寻找 codex.exe 路径的 bug, 反馈了之后一次就修好了. 这期间没有人工 review 过代码, 只是在每个 Phase 完成时候手动测试指定功能. 整个过程中 VSCode 的 codex 插件有时候会在提示用户点击选项时卡住. 生成代码时倒是很稳定, 不会出现 Antigravity 中那样需要 retry 的 Agent error. 不过 codex 在单个文件有大范围修改时倾向于删掉整个文件重写, 不知道具体原因是什么.

    当然这种项目我是肯定不会发出去害人的, 自己凑合用用没问题, 炸了就修. 后续再测试一下他在一万行有效代码项目中的表现.

    现在 AI 编程给我的感觉就类似辅助驾驶, 在简单场景下很方便, 但是营销吹的太过, 厂家又不负责. 要真正用好它,首先自己必须有编程基础(有驾照), 并且了解项目的相关领域和技术栈(驾驶准驾车型), 对 AI 能力边界有认知(知道哪些情况不能用辅助驾驶),要不然出个意外肯定翻车了(AI 弄出的 bug, 用户自己也不会修) 全自动一路 Yes, 不人工 review 完成的这种项目仅限于快速原型验证和自用项目, 真要开源给别人用或者正式交付肯定是不行的.

    6 条回复    2026-02-11 18:16:15 +08:00
    Jaufey
        1
    Jaufey  
       1 天前
    5.3 是必须要在 codex app 里面才可以使用吗,我目前 windows codex cli 里面没有 5.3 ,还是只有 5.2
    xiaoz
        2
    xiaoz  
       1 天前 via Android   ❤️ 1
    感谢分享,完全认同最后一段话。
    cellsyx
        3
    cellsyx  
    OP
       1 天前
    @Jaufey Business 订阅在 windows codex cli(就是用 npm i -g @openai/codex 安装的那个, 我在 Windows terminal 里使用) 和 VSCode Codex 插件都可以选 GPT-5.3-Codex 模型. 我已经只使用 cli 了, VSCode Codex 插件经常在提示用户批准操作的界面卡住, 完全没法用.
    ostrichb
        4
    ostrichb  
       13 小时 12 分钟前
    今天早上還有看到 OpenAI 給部份用戶偷偷把 GPT-5.3-Codex 偷偷降級成 5.2 的,好搞笑 https://github.com/openai/codex/issues/11189
    Wkj1998
        5
    Wkj1998  
       9 小时 51 分钟前 via Android
    分情况啊,你要是不是专业从事软件开发的,那就是很完美的工具,但你是吃这碗饭的,用这个工具对你来说就是辅助啊,毕竟他要是真正能代替你干活,老板还要你干嘛
    Jaufey
        6
    Jaufey  
       5 小时 42 分钟前
    @cellsyx 很好,用上了。Codex5.3 确实比 5.2 要更强,一次性做很多工作,特别通人性,甚至引入了比较 trick 的测试、验证手法,手法非常的老工程师,更进一步地减少了多轮对话间需要人手动操作的碎片行为。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1766 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 15:58 · PVG 23:58 · LAX 07:58 · JFK 10:58
    ♥ Do have faith in what you're doing.