• 请不要在回答技术问题时复制粘贴 AI 生成的内容
Had
V2EX  ›  程序员

一个稍稍严肃的 Infra 开发, 200 刀 Codex 周消耗量

  •  
  •   Had · 23h 10m ago · 4140 views

    5 月 12 日下午 3 时刷新了一周用量,到 5 月 15 日下午用完,下次刷新要等到 5 月 19 日了,套餐是 ChatGPT 200 刀,模型是 gpt-5.5 high fast 。

    Infra 开发进入中后期(加模块),习惯是 Codex 主程(一个长期的 session ,token 使用量已经有 3.3B 左右),然后另开两个 Codex Review ,再加两个 Claude Code Review(100 刀套餐)。偶尔零散单开,忽略之。

    按下面的统计来看,周用量如果跑标准 5.5API 大概是 1200 刀,fast 走 Priority ,也就是 2.5 倍是 3000 刀,但是套餐费是 200/4=50 刀。

    分享一下供大家参考,以下使用了 https://github.com/huajiexiewenfeng/codex-token-usage-skill 这个 skill ,略修改提供按日的数据。

    范围: 2026-05-12 to 2026-05-15 调用次数: 10,612 会话数: 17

    指标 Token 数 说明
    总量 1,697,105,658 total_tokens 汇总
    Input 1,684,776,812 输入 token ,包含 cached input
    Cached input 1,617,974,144 命中缓存的输入 token
    Output 3,181,341 输出 token
    Reasoning output 967,432 推理输出 token
    非缓存 Input 66,802,668 Input - Cached input
    净用量 69,984,009 非缓存 Input + Output
    缓存命中率 96.03% Cached input / Input
    日均总量 424,276,414.50 总量 / 统计天数

    最多的一天: 2026-05-14, 590,184,843 tokens.

    日期 总量 Input Cached input Output Reasoning output 非缓存 Input 净用量 缓存命中率 调用次数 会话数
    2026-05-12 332,727,335 330,002,701 317,752,064 639,247 196,753 12,250,637 12,889,884 96.29% 2,056 6
    2026-05-13 568,982,985 564,878,467 542,723,712 1,123,134 395,888 22,154,755 23,277,889 96.08% 3,616 10
    2026-05-14 590,184,843 586,391,899 564,809,728 1,047,875 269,174 21,582,171 22,630,046 96.32% 3,660 8
    2026-05-15 205,210,495 203,503,745 192,688,640 371,085 105,617 10,815,105 11,186,190 94.69% 1,280 5
    Supplement 1  ·  14h 0m ago
    codex 是默认 258K 的上下文,长期 session 一个小问题是每次 compact 回来大概就剩 60%,当然 codex 的 compact 是记得住刚才做到哪里的,不像 claude code 那样记不住
    32 replies    2026-05-17 05:33:08 +08:00
    xiaowangdegushi
        1
    xiaowangdegushi  
       22h 47m ago
    还是太贵了 人民币 50 能接受
    shuangchun
        2
    shuangchun  
       22h 26m ago
    如果是在硅谷,这不是便宜到爆炸
    beyondstars
        3
    beyondstars  
       22h 25m ago
    现在不比代码行数了,都比 token 消耗量了。
    ktyang
        4
    ktyang  
       22h 15m ago
    output 占比这么高么
    ktyang
        5
    ktyang  
       22h 15m ago
    不好意思,看错了。。。
    Had
        6
    Had  
    OP
       22h 12m ago
    @beyondstars
    代码行数也没啥好比的,我巴不得它写的越少越好
    Had
        7
    Had  
    OP
       22h 9m ago
    @beyondstars
    想了想 偏了啊 本意也不是比 token 消耗量啊 而是说一个 200 刀套餐到底能用多少
    我是不愿意 AI 往冗余了写的,毕竟 Infra
    davis2023
        8
    davis2023  
       21h 56m ago
    看了 OP 的统计,想到一个点如果 API TOKEN 价格如果太高,到一定程度,请一个碳基反而比硅基便宜,碳基的开发至少能看到成果后付钱,硅基有时候是开盲盒还要提前付费
    vimutt
        9
    vimutt  
       21h 54m ago via Android
    还是你们的行业真正在用这个东西啊,我和我媳妇两人买的 codex 5x,结果一个月连百分之十也用不上,亏死了,想换 pro 又怕不够用
    panf233333333
        10
    panf233333333  
       21h 36m ago
    太香了,先上了 5x 的车。到期看看上不上 20x 的
    saltbo
        11
    saltbo  
       20h 35m ago
    你的统计方式好麻烦啊,自荐下我的 https://wakatoken.com

    我的主页 https://wkt.tftt.cc/u/saltbo
    Had
        12
    Had  
    OP
       20h 32m ago
    @saltbo
    呃 统计不是我的需求,我只是看到这个 skill 好奇月费的周限额大概是多少,通常情况下我也是不在乎用了多少 token 的

    另外,如果让我装 client ,我大概是不会装的
    xwhxbg
        13
    xwhxbg  
       20h 17m ago
    我也是 infr ,之前 3 个 codex 号都开 20 刀套餐有点不够用,现在一个月一百刀的正好够
    tyhunter
        14
    tyhunter  
       19h 59m ago
    @vimutt 不做 coding 的其实 plus 都够用了,我媳妇用网页版当 chatbox 用,我用 codex 做数据分析,plus 将将够
    alexluo1
        15
    alexluo1  
       19h 58m ago
    GPT 100 刀是性价比最高的套餐,有 10 倍 plus 额度,下个月回到 5x 就转 Claude 了
    foxkiller
        16
    foxkiller  
       19h 41m ago

    一个严肃副业 AI 开发(算法)的 claude 用量。
    这还是一部分代码 subagent 扔给 codex 写的情况下。
    2 个 claude max + 1 个 GPT Pro 订阅……
    winnerczwx
        17
    winnerczwx  
       18h 2m ago
    @davis2023 前提就不成立, 一个人的月度用工成本能换 10 多个 gpt 20x, 相当于两三百个 plus. 其次就是人类完成任务他就一定靠谱吗...?
    xe2vherd
        18
    xe2vherd  
       17h 9m ago


    十个工作日的使用量
    teaguexiao
        19
    teaguexiao  
       14h 3m ago
    96% 缓存命中率才是这个数据里最有意思的部分,证明长期 session 的制度对 Infra 开发真的适用。换成频繁重启 session 的玩法,这 200 刀几天就烧完了。
    Had
        20
    Had  
    OP
       14h 1m ago
    @teaguexiao
    嗯 但是话又说回来,codex 长期 session ,上下文可用空间就比较有限了,每次 compact 之后可用的就剩 60%左右了
    当然 codex 的 compact 还是有用的,不像 claude code 那样好像和第一次相见一样
    Had
        21
    Had  
    OP
       13h 54m ago
    @winnerczwx
    @davis2023
    我其实又联想到第一个回复
    如果默认这些工作是 50 人民币可以完成的
    那么传统意义上码农真的就是连送外卖都比不过了
    winnerczwx
        22
    winnerczwx  
       13h 47m ago
    @Had #21 如果当现在的软件成本变得极低的时候, 人们对于软件需求的层次就会提高了. 只有当人们的需求停滞不前(或者不愿意为新需求付费)的时候, 码农才会消失
    winnerczwx
        23
    winnerczwx  
       13h 46m ago
    @winnerczwx #22 不过生产力的增加, 降低了岗位数量是实打实的
    hez2010
        24
    hez2010  
       13h 35m ago
    你可以把 fast 关了。fast 花费原来的 2.5 倍用量但是速度只提升 50%,完全不值。
    Had
        25
    Had  
    OP
       13h 28m ago
    @hez2010 上个周快用完之前也关了,这周主要是看 fast 到底能用到多少,如果是长任务,关掉确实好点
    yu180
        26
    yu180  
       12h 43m ago
    这么高? fast 还是太贵了,我开了 10x 的 周限额 用了一天半 已经用了 30% 了
    me1onsoda
        27
    me1onsoda  
       10h 45m ago
    对你工作效率的提升呢
    saltbo
        28
    saltbo  
       10h 13m ago
    @Had #12 客户端是开源的 只上传 token 用量 云的作用是解决长期积累的问题 以后你用个一两年 三五年之后 本地可能丢了 就算没丢 全量算一次也很慢
    zhouu
        29
    zhouu  
       9h 51m ago
    今天 codex 额度会重置吧
    xubeiyou
        30
    xubeiyou  
       6h 39m ago
    @foxkiller 一万多刀啊 ,。。我有点好奇带来多少了
    openercn
        31
    openercn  
       3h 54m ago
    这类用量里最值得盯的不是 total tokens ,而是非缓存 input 、失败重试和长 session 的上下文膨胀。

    Infra 中后期我会把主程和 Review 拆成更明确的运行边界:固定环境、可复现命令、日志入口、变更范围和退出码都留痕。这样缓存命中高时成本可控,出问题时也能知道是哪一轮把上下文或验证链路拖大了。
    foxkiller
        32
    foxkiller  
       2h 33m ago
    @xubeiyou #30 3 倍左右吧
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3700 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 96ms · UTC 00:06 · PVG 08:06 · LAX 17:06 · JFK 20:06
    ♥ Do have faith in what you're doing.