抛开性价比这个选项，你认为目前写代码最强模型是？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 135 天前的主题，其中的信息可能已经有所发展或是发生改变。

答案无疑肯定是在 Codex 和 Claude Sonnet/Opus 中产生。

为什么要抛开性价比这个选项？

我发现现在甚至有人还在吹 Deepseek 、GLM 。

2025 年了，哪吒票房那段时间还没完？年还没过完？

吹的有两种人（我说的比较难听）：

用不起贵的，强行拉出性价比，所谓的便宜好用。
爱国，大谈 Claude 敌对势力。

所以，你认为

抛开爱国情绪、抛开花费，目前写代码最强模型到底是 Codex 还是 Claude ？

没深度使用过多家的，没对比过的，只用过某一种的，回答也基本没有什么参考价值。

Codex

Claude

性价比

79 条回复 • 2025-10-09 10:10:03 +08:00

mooyo

2025 年 10 月 3 日 via iPhone

claude-sonnet-4.5

yuanyuan11

2025 年 10 月 3 日 via Android

claude-sonnet-4.5

和这个比起来国产的像低能儿

TimePPT

PRO

2025 年 10 月 3 日 via Android

GPT-5 High

ty29022

2025 年 10 月 3 日 via iPhone

我个人的感觉是 gpt5 像个 cs 科班的大佬
claude 像个经验丰富的中级程序员对复杂情况无能为力

novaren

2025 年 10 月 3 日 via Android

claude 毋容置疑

facebook47

2025 年 10 月 3 日 via Android

Claude 写代码无敌，另外在这个论坛，头一次听说有人吹 deepseek 的，一拉一踩非常不可取

spike0100

2025 年 10 月 3 日 via iPhone

我自己用下来 glm 其实还好。主要差别是 claude sonnect 4.5 一般一次生成的代码直接就可以跑，glm 需要主动提醒一两次才能调好。最终效果感觉差别不大。

spike0100

2025 年 10 月 3 日 via iPhone

@spike0100 都是用 claude code + 对应基础模型测的。deepseek 和 qwen3 max 试过跑了 50 ，60 人民币的 token ，结果都没法看。

takanashisakura

2025 年 10 月 3 日

说性能的话毋庸置疑吧。但是在真正用的时候，很难不考虑性价比和可用性吧。
所以我也没得选，只有 deepseek 和 gemini 。

xiaojie668329

2025 年 10 月 3 日

有时候 Gemini 做得比 Claude 好

raydg7777

2025 年 10 月 3 日

还是 Codex

Alias4ck

2025 年 10 月 3 日

吹 glm 的和 deepseek 的肯定是没吃过细糠

victor

2025 年 10 月 3 日

claude 够快所以是主力。但 claude 4.5 写完的功能，codex 还能挑出来一堆毛病。

skiy

2025 年 10 月 3 日

你抛开花费但抛开不了人家不让你用吧？这是不可控因素。刚刚又有 up 说自己被封号了。

user1284

2025 年 10 月 3 日

抛开花费我选同时使用几个顶尖模型，然后每次需求选择最好的一个结果，即使不同时使用也可不断轮换使用对比每个模型擅长领域。

lithiumii

2025 年 10 月 3 日 via Android

可能有一个月没写代码了，之前是用免费的 copilot 里的旧版本 gpt （好像是 4.1 ）和 Claude （ 3.5 吧大概）或者用 Aider 调免费的 Gemini 2.5 Pro ，或者付费的 DeepSeek V3 或者 3.1 和 GLM 4.5 （这俩便宜）。
体感最强是 Gemini 2.5 Pro ，其次相差不远是 DS 和 GLM ，免费 copilot 送的模型是真的不行了。

haiku

2025 年 10 月 3 日 via Android

GPT 5 high
下个月等 Gemini 3

streamrx

2025 年 10 月 3 日 via iPhone

gpt5 high

zpvip

2025 年 10 月 3 日

claude-sonnet-4.5
这个是毒品, 不能碰

Imindzzz

PRO

2025 年 10 月 3 日 via Android

你想抛开谈就抛开谈呗，为啥要贬低一下“吹”deepseek...

mywjyw

2025 年 10 月 3 日

codex cli 做的比 claude code 差，很多功能不全，很难用

lancevps

2025 年 10 月 3 日

生成 html 的 UI 设计稿，豆包最强

sunnysab

2025 年 10 月 3 日

额，倒也不是爱国情绪，https://www.reddit.com/r/LocalLLaMA/

reddit 上很多外国人考虑中国的模型，超级积极… qwen 和 glm 评价不错。llama 挨骂较多，openai 被骂的也不少

Thymolblue

2025 年 10 月 3 日

现在用 GPT-5 和 Claude 有什么渠道吗？直接用 API 都需要组织认证，目前国内身份没法通过

yyws2012

2025 年 10 月 3 日 via Android

@mooyo 都不考虑价格了还 sonnet

yyws2012

2025 年 10 月 3 日 via Android

@skiy 可以买别人转接的，就是 opus 会非常贵，但既然不考虑价格那就是可以的

ggp1ot2

2025 年 10 月 3 日

Claude Sonnet 4.5

没有什么价格不价格的，这个模型可以满足我现在的需求

mooyo

2025 年 10 月 3 日

@yyws2012 #25 sonnet 4.5 现在就是比 opus 4.1 好用啊。有又快又好用的为啥要用又慢又垃圾的

charles0

2025 年 10 月 3 日

GPT-5 high (比 GPT-5-Codex 强很多)

Bad0Guy

2025 年 10 月 3 日

cc ，但是封号比 codex 还疯狂，如果 Gemini3 效果比 Claude4.5 好那我会考虑日常转用 Gemini3

Gekou

2025 年 10 月 3 日

没用过 claude ，但 claude 肯定不能一次处理 100w 的 token ，10w 行代码
反驳请给出详细方法谢谢

plasticman64

2025 年 10 月 3 日

claude 会找 bug ，这是我最佩服的一点

v20220522

2025 年 10 月 3 日

@charles0 为什么会这样, 能展开讲讲吗?

lcandy

2025 年 10 月 3 日

@TimePPT 支持，codex-high 都没 5-high 好用

agagega

2025 年 10 月 3 日 via iPhone

为了那点所谓的优势整天琢磨哪个模型在 benchmark 里表现更好真的有意思么，还不如找到一个坚持用下去。有 gemini 用 gemini ，没有用 deepseek-v3 也能达到目的。天天炒作 claude 看着都麻了，是不是公司的政治观点还会影响用户？

jonty

2025 年 10 月 3 日

2025 年了，还有人在对比最强模型？谁不知道 claude 好用，是大家不想用吗？

rubyacgn

2025 年 10 月 3 日

谁没事国庆写代码啊

binaryify

2025 年 10 月 3 日

Codex 虽然有点慢但是经常一步到位, claude 像是应届生,着急写代码,但是经常返工

bytesfold

2025 年 10 月 3 日 via iPhone

Claude 4.5 体感跟 Codex 效果区别不大了；
Claude 4 体感就是愣头青

asuka02

2025 年 10 月 3 日 via Android

你这是从抖音学的标题吗？

zy5a59

PRO

2025 年 10 月 3 日

我感觉这两个是互补的，codex 写逻辑强一些，但是 UI 写出来是真丑，claude 正好相反

xuhuanzy

2025 年 10 月 3 日 via Android

codex 上下文读取很激进，对于复杂项目效果远超 claude

Bluecoda

2025 年 10 月 3 日

claude-sonnet-4.5 用下来比 gpt5-high 强多了，速度又快，体验感太棒

kennylam777

2025 年 10 月 3 日

@sunnysab Local AI 來講中國的開放 LLM 的確不錯, 但私有商業 SOTA(只賣 API 那種)模型比還是比中國模型強

welcomezhangjun

2025 年 10 月 3 日

claude-sonnet-4.5

coderlxm

2025 年 10 月 3 日 via Android

codex-gpt5-high

bf109_

PRO

2025 年 10 月 3 日

codex cloud 吊打一切

yjxjn

2025 年 10 月 3 日

claude-sonnet-4.5
CodeX

Aolose

2025 年 10 月 3 日

抛开性价比？那我选择牛马大模型

gfbts

2025 年 10 月 3 日

@Aolose 牛马竟是我自己

mendax2019

2025 年 10 月 3 日

gemini 2.5 pro ，快也是强

povvoq

2025 年 10 月 3 日

顺便想问问大家，各位用这些模型的时候都是开箱即用吗
会不会有什么奇技淫巧是我不知道的

BernieDu

2025 年 10 月 3 日

@xuhuanzy codex 读的上下文可能更多，你让他给代码找错确实更好用，但是一旦让它上手干活比 4.5 差远了，还是搭配着用吧

ferock

PRO

2025 年 10 月 3 日 via Android

cl 4.0 ，没钱用 4.5 还没体验过

andrew2558

2025 年 10 月 3 日

现在这些大模型写代码是真的强呀，期待 gemini3

gmuubyssss

2025 年 10 月 3 日

@sunnysab 跟人家天天骂川普一样，你能天天????????

jiayouzl

2025 年 10 月 3 日

毫无疑问 claude-sonnet-4.5

salor

2025 年 10 月 3 日

写代码 GPT-5 High ，修 bug GPT-5 Pro

Seck

2025 年 10 月 3 日 via Android

没有先发优势？
强者恒强，互联网的赢者通吃效应？🌚

超过，想过了，直到 ai 热潮结束，也不能超过！

要真是超过才是危险的，妈的做了三个版本才火起来，今天对面随随便便，资源比你少，人才投入比你少，市场价格比你低，然后被超越

那估计三战就来了，创新失败效应才是人类社会进步最后的壁垒，如果创新者被对面：资源，人才，技术，市场，教育都不如你超过……那世界才真有意思

234ygg

2025 年 10 月 3 日

但凡有点水平的代码，gpt 明显强一大截，垃圾代码的话 claude 和 gpt 差不多

wangweiggsn

2025 年 10 月 4 日

@mendax2019 我也用的 Gemini Pro 2.5, 注册 API 免费，vscode 里配置一下 API key 直接用，我用量没超，一直是免费的。

qoras

2025 年 10 月 4 日

gpt5-high 比 gpt5-codex 好，就是有点慢，不过可以加钱用 gpt5-high-fast

kulove

2025 年 10 月 4 日 via Android

抛不开用了几天 Codex 效果差很多

novaa

2025 年 10 月 4 日

windows 下用了下 codex 跟个智障一样各种错误

lscho

2025 年 10 月 4 日 via Android

你想问就问，非要贬低一下别人。。。

其实所有模型都试用一两个月你就会发现，所有的模型都有它擅长和不擅长的。

而且每个人的使用习惯不一样（提示词习惯、规则配置、项目配置等），甚至网络环境的区别都会导致他对不同的模型体验不一样。

所以这玩意目前我觉得没有固定答案，每个人都可以多试用几种来找到最合适自己的。

就个人而言，claude 在大多数情况下符合预期，但是在少部分情况下确实有可能表现的还没有其他模型好。所以我已经习惯多种模型交叉验证解决稍微复杂的问题。

shintendo

2025 年 10 月 4 日

lovdanny

2025 年 10 月 4 日 via Android

我最近真切感受到 Codex 的强大——比我之前在 Cursor 里用的 Claude 模型更稳，也更少生成冗余代码。最近我用 Codex 一口气写完了一个 Rust 命令行工具（用于处理 TSV 和 Excel 表格数据，tsvkit： https://github.com/dawnmy/tsvkit ），基本上都是一次就过。

前期用的是 Local 模式，额度用完后换成 Cloud 模式，结果真是让我震惊，在这种通用编程任务上，AI 已经可以做到几乎“代写”了，人只需要提清楚需求就行。

kneo

2025 年 10 月 4 日 via Android

不知道是不是错觉，前段时间 claude 降智，到现在我觉得 sonet 4.5 也智障一样，没缓过来。都在推 sonet 4.5 我还挺意外的。

Wkj1998

2025 年 10 月 5 日 via Android

@Gekou 这么多代码，逻辑复杂应该只有 GPT-5-high 、Gemini2.5 Pro 能处理了，

Wkj1998

2025 年 10 月 5 日 via Android

GPT-5-high 、Claude Sonnet4.5 、不截断的 Gemini2.5 Pro ，最重要的是互补，每个 LLM 都有短板，要取长补短

anteros

2025 年 10 月 5 日

哪个被骂的人最多，就用哪个。我说的是世界范围内。

yippee0539

2025 年 10 月 5 日

之前也是一直用 claude
但是架不住贵/白嫖的不稳定
索性 dp 了，够用、快、稳定、便宜

byasm32

2025 年 10 月 5 日

Gemini 2.5 Pro 已经完全够用。。超长上下文支持，几百 k 的附件代码也随便分析，速度也快。

yyws2012

2025 年 10 月 5 日 via Android

@byasm32 gemini 非常擅长讲述内容，但是在分析较多内容时幻觉严重，之前我让它分析代码它能信誓旦旦地说出一个不存在的 feature

ptstone

2025 年 10 月 5 日

”我发现现在甚至有人还在吹 Deepseek 、GLM “ 。八月底九月初的时候，我用 deepseek 和 sonet 4 ，同样的提示词写一个项目，deepseek 做的 ui 效果明显强与 sonet4.1 。都是用 claude code 。后来放弃了 sonet4 生产的项目，用 sonet 4 接着 deepseek 生成的项目接着写后端，做单一任务，deepseek 在某些方面不一定差，做复杂任务，需要关联很多代码，你不提示 deepseek 会不读仓库其他代码直接写，sonnet 不降智的情况下，会读应用到的代码。凡是不要这么武断下结论。

fourninenine

2025 年 10 月 6 日

我就是第一种人😁我来反驳第二种
什么叫“大谈敌对势力”？
deepseek 不让美国人用了吗？
到底是谁在搞敌对？

Vaspike

2025 年 10 月 7 日 via iPhone

写 UI 我个人觉得 Gemini 依然最强

NineTree

2025 年 10 月 8 日

claude code

millken

2025 年 10 月 9 日

Claude Sonnet 4.5 确实用起来最爽