V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
leegoo
V2EX  ›  OpenAI

Claude 3.7 Sonnet 横空出世!混合推理暴击编程极限, AI 编码王者再次傲视群雄

  •  1
     
  •   leegoo · 31 天前 · 12147 次点击

    全球首个混合推理模型 Claude 3.7 Sonnet 正式登场!

    Anthropic 祭出杀手锏,将即时响应与可扩展思考融为一体,彻底颠覆 AI 能力边界。 Anthropic 祭出杀手锏 更多信息查看推文: https://x.com/alexalbert__/status/1894093648121532546

    生态联动升级

    同步亮相的 cusor ( 0.46.3 ),

    已经接入 Claude 3.7 Sonnet;

    不知道白嫖用户可不可以使用 0.0

    更多信息查看推文: https://x.com/alexalbert__/status/1894093648121532546

    正式迈入“动嘴指挥”纪元?

    95 条回复    2025-02-27 10:45:22 +08:00
    mumbler
        1
    mumbler  
       31 天前   ❤️ 1
    刚刚看到 cursor 可选 3.7 了,实测编码能力肉眼可见的提升
    IDAEngine
        2
    IDAEngine  
       31 天前
    确实可以,编码能力秒杀绝大部分 IT 民工,公司又要裁人了 [😭]
    xubingok
        3
    xubingok  
       31 天前
    cursor 还是 0.45..检查更新超时..
    官网下载也是 0.45.
    crocoBaby
        4
    crocoBaby  
       31 天前   ❤️ 1
    编程已死
    frankies
        5
    frankies  
       31 天前
    虽然但是,这标题一眼百家号啊,营销号的味儿扑面而来😅
    flyespace
        6
    flyespace  
       31 天前
    官网还是 0.45 啊,升级后也是 0.45 呢,你的 0.63 是哪里来到呢
    letwewell
        7
    letwewell  
       31 天前
    傲视群雄,遥遥领先
    HFX3389
        8
    HFX3389  
       31 天前
    @xubingok #3
    @flyespace #6
    我更新升级之后是 0.46.3 (user setup)
    arer
        9
    arer  
       31 天前
    @flyespace 已经可以更新了
    Lemonadeccc
        10
    Lemonadeccc  
       31 天前
    还没试,打开 cursor 已经可选了
    SawyerGuo
        11
    SawyerGuo  
       31 天前
    GitHub Copilot 能上 3.7 吗
    greygoo
        12
    greygoo  
       31 天前
    可以价格不变,推一手 openrouter+aline.已经用上了
    Dlin
        13
    Dlin  
       31 天前
    64k extended thinking 的 agentic codeing 是个“-”是标识不支持么?
    magic3584
        14
    magic3584  
       31 天前
    @greygoo #12
    大佬是 Cline 吧?我用本地模型不太好用
    idblife
        15
    idblife  
       31 天前
    @flyespace
    已更新至 0.46.3 ,正在用实际问题测试中,初步感受确实 nb
    magic3584
        16
    magic3584  
       31 天前
    @HFX3389 #8
    user setup 是哪?
    我放开更新后,0.45.11 ,不过 cursor 确实可选 3.7 了
    greygoo
        17
    greygoo  
       31 天前
    @magic3584 是 Cline 打错了,我用的是 fork 版 Roo Code 非常好用加上 openrouter 的 sonnet 3.5,有点小贵,但是非常强
    greygoo
        18
    greygoo  
       31 天前
    @greygoo #12 打错了是 Cline
    magic3584
        19
    magic3584  
       31 天前
    @greygoo #17
    感谢大佬推荐。我目前还在白 piao cursor,费功夫但是省钱😂
    cxe2v
        20
    cxe2v  
       31 天前
    不用更新 cursor ,重启下直接看到 claude 3.7 的 model 了
    redbeanzzZ
        21
    redbeanzzZ  
       31 天前
    0.45 也能选 3.7 模型
    honjow
        22
    honjow  
       31 天前 via iPhone
    windsurf 啥时候支持🤔
    Stevenv
        23
    Stevenv  
       31 天前   ❤️ 1
    继续吹。
    aeron
        24
    aeron  
       31 天前
    @honjow 已经支持了,最新 1.3.6 版本已经提供 3.7 模型,但是我看下载界面还是 1.3.4 版本的
    LoLSilence
        25
    LoLSilence  
       31 天前
    @mumbler 实测了什么,肉眼可见的提升了,看看
    bitmin
        26
    bitmin  
       31 天前
    看了下 github copilot 也有 3.7 和 Thinking 了
    max1024
        27
    max1024  
       31 天前
    @aeron mac intel 的还没有看到
    mumbler
        28
    mumbler  
       31 天前   ❤️ 1
    @LoLSilence #25 上周项目卡了个 BUG ,很复杂,人不花个 1 个月根本理不清里面的关系,之前用 o3 mini,o1,claude 3.5,deepseek r1 都没解决,今早用 3.7 一次就解决了
    Lemonadeccc
        29
    Lemonadeccc  
       31 天前
    用 3.7 优化代码感觉没有 3.5 的实在,目前只测了这一个
    Comyn
        30
    Comyn  
       31 天前
    @bitmin 刚看了我的还没有
    SniperXu
        31
    SniperXu  
       31 天前
    @bitmin 不懂就问,thinking 和不带 thinking 的有啥区别
    xubingok
        32
    xubingok  
       31 天前
    @SniperXu #31 带 thinking 是具备推理的....不过实际上大部分日常代码用普通的就行了.
    DosLee
        33
    DosLee  
       31 天前
    ![101800@2x.png]( https://image.dooo.ng/c/2025/02/25/67bd288116ffc.webp)
    Github Copilot 已经可以用了
    sakeven
        34
    sakeven  
       31 天前
    测试了一下 3.7 。太喜欢调用工具了...很多问题都不需要调用工具的
    非常的激进
    ddmasato
        35
    ddmasato  
       31 天前
    vscode 已经同步跟进。。。。
    tonytonychopper
        36
    tonytonychopper  
       31 天前   ❤️ 15
    一大波文章即将来袭:《前端已死》、《代码已死》、《编程已死》、《 10 分钟我做了一个网站》、《一周用 cursor 做了 3 个 APP 》……
    letmatte
        37
    letmatte  
       31 天前
    3.7 配合 Cline 尚不支持 computer use 和 prompt caching 呀
    3.5 支持
    mywjyw
        38
    mywjyw  
       31 天前
    3.5 已经足够出色,这么快就有 3.7 更上一层楼,Anthropic 恐怖如斯
    HFX3389
        39
    HFX3389  
       31 天前   ❤️ 2
    @mumbler #28 想听听有多复杂然后 3.7 解决后豁然开朗的故事
    javalaw2010
        40
    javalaw2010  
       31 天前
    歪个楼,问下 github copilot 可以用 3.7 的小伙伴,你们是订阅了么,我免费计划一直看不到 3.7 ,官网上也说 3.7 对免费计划不可见。
    HFX3389
        41
    HFX3389  
       31 天前
    @magic3584 #16 我是今天早上右下角弹了个 Cursor Update ,更新完了就是 0.46.3 了
    Yeo0o
        42
    Yeo0o  
       31 天前
    真不错,copilot 也更新了。
    bitmin
        43
    bitmin  
       31 天前
    @javalaw2010 #40

    我是订阅了,在 vscode 上可以选到 3.7 ,JB 上不能
    mywjyw
        44
    mywjyw  
       31 天前
    我在 cursor composer 里用了一下 3.7 ,怎么感觉还变笨了呢...一个问题说了三四次解决的一坨
    dongzhuo777
        45
    dongzhuo777  
       31 天前   ❤️ 1
    @mumbler #28 能专门开个贴说说怎么理清的吗。现在这种 AI 编码工具可以辅助排查那种屎山项目吗 比如那种纯业务代码 跑了 10 年 20 年的 准备重构。缺少文档。几十万行 需要借助 AI 来梳理
    cluefly
        46
    cluefly  
       31 天前
    @Lemonadeccc 等试用结果吧
    infinityv
        47
    infinityv  
       31 天前 via iPhone
    这图看 grok3 才是整体最强的?
    lthero
        48
    lthero  
       31 天前
    @infinityv #47 是的
    LaTero
        49
    LaTero  
       31 天前
    确实挺强的,thinking 还没试,普通模式感觉应用数学有不少进步。不过我看他们的博客,好像最大的提升是为了各种 agent 工具、tool use 、AI IDE 做的,但是目前 AI 工具都是围绕在前端和 VS Code ,非前端可能提升不是很大,JetBrains 在 AI 方面实在是太令人失望了。
    mumbler
        50
    mumbler  
       31 天前
    @dongzhuo777 #45 说那么多不如你亲自试试,20 美金而已,用 cursor 打开项目目录,ctrl+i 修改或者增加功能即可,这个钱绝对是花得最值的
    AsuorZ
        51
    AsuorZ  
       31 天前
    @SawyerGuo 付费用户有
    boleyn1992
        52
    boleyn1992  
       31 天前   ❤️ 2
    已经更新 Claude 3.7 Sonnet ,可以体验 https://datapipe.app
    vipfts
        53
    vipfts  
       31 天前
    @Stevenv 遥遥领先, 遥遥领先啊
    vipfts
        54
    vipfts  
       31 天前
    @tonytonychopper 狼又来啦~
    zgxxx
        55
    zgxxx  
       30 天前
    cursor 里面试了一下 Claude 3.7 Sonnet ,它每次提供完代码后又继续:我发现可以提供更加完善的代码方案...根本停不下来
    dreamingclj
        56
    dreamingclj  
       30 天前
    @mumbler #1 3.7 还是 3.7 thinking ?
    magic3584
        57
    magic3584  
       30 天前
    @HFX3389 #41
    我日常都屏蔽 cursor 更新,今天是主动放开去自动更新的
    wangyzj
        58
    wangyzj  
       30 天前
    除了干代码这件事就没别的可以干的么?
    kw8023cn
        59
    kw8023cn  
       30 天前
    @frankies cursor 的软广,话说 cursor 的推广真疯狂,但是真有人会为了 iede 或者 vscode 插件搞定的事情,而放弃成熟的 IDEA 转投 cursor ?
    hanqian
        60
    hanqian  
       30 天前
    编码这一项非推理模型比其他家的推理模型还牛逼,真就是护城河了
    zhangeric
        61
    zhangeric  
       30 天前
    我觉得 deepseek 就搞用了.
    tyrantZhao
        62
    tyrantZhao  
       30 天前
    claude 封号不是很严重么?
    layxy
        63
    layxy  
       30 天前
    @kw8023cn 来回切很烦人,我一直用不习惯 vscode(基于 vscode 的编辑器看起来总感觉不太舒服),奈何 idea 的插件都太拉跨
    qwertyzzz
        64
    qwertyzzz  
       30 天前
    @kw8023cn 怎么了 我就是
    chesha1
        65
    chesha1  
       30 天前   ❤️ 1
    在 anthropic 官方的 workbench 里用 api 试了一下,写代码能力确实强,我有一个 ui 组件库的问题,之前只有 gpt-4o 和 o1-preview 能做出来( o3-mini, o1, R1 都不行),现在 claude 3.7 也能做出来了,而且做得最好

    其他普通的 cs 领域的问题,日常问题,没测出来明显优势,但是编程确实好

    测试记录: https://echoccc.online/posts/llm-test
    A555
        66
    A555  
       30 天前
    后端好用吗,重构屎山呢
    HXM
        67
    HXM  
       30 天前
    昨天在 cline 里让 sonnet 3.5 根据源码用 LaTeX TikZ 绘制示意图,给出的结果无法在 Overleaf 里正确编译,今天用一模一样的 prompt 让 3.7 试了一下,不仅能正确编译了还正确理解了代码逻辑。
    chesha1
        68
    chesha1  
       30 天前
    @dongzhuo777 #45 如果你说的重构是基于整个项目的,那现在任何 AI 都不行,上下文长度不够,模型底层限制在这里,不仅 cursor ,用什么工具都没用
    zorui
        69
    zorui  
       30 天前   ❤️ 1
    @kw8023cn 你自己去用用不就知道了, 被迫害妄想症?
    magic3584
        70
    magic3584  
       30 天前
    @greygoo #17
    请教大佬 Roo Code 跟 Cline 比有什么区别吗?
    murmur
        71
    murmur  
       30 天前
    @kw8023cn 那是因为 cursor 之前真就吊打其他家,现在 copilot 也支持 sonnet3.7 模型了,大家又站在同一条起跑线上了

    还有 cursor 有重构模式,会直接改代码,补充缺失的文件
    xingyue
        72
    xingyue  
       30 天前
    @HXM 巧了,我也是,昨天用 3.5 帮我改 bug ,改得一坨,今天 3.7 thinking 直接拿下.....真令人焦虑啊
    mumbler
        74
    mumbler  
       30 天前   ❤️ 4
    @kw8023cn #59 cursor 是编程的革命,不需要投广告,你还在意 IDE 说明你思想还在手写代码时代,AI 能自动写代码用什么 IDE 已经不重要了,你要不信,那就继续刀耕火种,等你都醒悟过来,已经在败者组了,就像李彦宏进了败者组,现在做什么百度都死路一条
    jianyestudy
        75
    jianyestudy  
       30 天前
    羡慕人民币玩家
    chesha1
        76
    chesha1  
       30 天前
    我订阅了,但是只能在 copilot chat 里用 claude 3.7 ,copilot 本体的 completions models 还是选不了 claude 3.7
    kkchan1999
        77
    kkchan1999  
       30 天前
    @SawyerGuo 上了
    yplam
        78
    yplam  
       30 天前
    @SawyerGuo vscode insider 版本测过可以,Agent 模式加上 Claude 3.7 效果很好
    zhw2590582
        79
    zhw2590582  
       30 天前
    @SawyerGuo 今天用上了
    xzylzz
        80
    xzylzz  
       30 天前
    昨天刚开会员,今天就有大更新,挺好
    HomeZane
        81
    HomeZane  
       30 天前
    你这标题,好奇怪呀
    c8c
        82
    c8c  
       30 天前
    你们是在个人的项目上使用这些模型吗? 在大的公司,应该都不允许使用这些外部模型吧? 担心泄露内部机密?
    encro
        83
    encro  
       30 天前
    trae 怎么还没更新呢
    leegoo
        84
    leegoo  
    OP
       30 天前
    @encro 这个是字节的把,怎么说字节是国内的公司,那么引入一个新的东西最起码也要内部审查(比如有没有需要和谐的东西)
    alphagao
        85
    alphagao  
       30 天前
    我是白嫖用户,可以用
    Scarb
        86
    Scarb  
       30 天前
    @aeron windsufr 怎么下载 1.3.6 呢,编辑器里检查更新,显示已经是最新了。现在是 1.3.4 版本
    rjagge
        87
    rjagge  
       30 天前
    3.7 在 curosor 上已经使用, 目前的感觉是比 3.5 更能听懂人话了, 而且给的代码建议也非常的克制. 以前 3.5 动不动就想给你把项目一整个优化, 添加一大堆不需要的功能, 现在做 debug, 给的建议非常清爽.
    aeron
        88
    aeron  
       30 天前
    @Scarb 我也没找到下载地址,上午看更新日志里面已经有 1.3.6 了,但是没提供下载地址。刚去翻了下,更新日志里 1.3.6 也没了
    make1money
        89
    make1money  
       30 天前
    @chesha1 连自家的 gpt 都只能 4o ( preview ),别说 claude 了
    lovestudykid
        90
    lovestudykid  
       30 天前
    @infinityv 用下来才知道谁强,对 coding 来说 claude 绝对第一,R1 稍微落后
    daimaosix
        91
    daimaosix  
       30 天前
    Claude 卧槽🐂🍺已经用上了
    leegoo
        92
    leegoo  
    OP
       30 天前
    @daimaosix 兄弟你知道的太慢了 ~.~
    nickyadance23
        93
    nickyadance23  
       30 天前
    @layxy #63 插件做不到和编辑器的深度集成,jetbrains 有自己家的 AI 产品 jetbrains AI ,试用了下跟 cursor 体验还是差挺多的。我也是不习惯 vscode ,现在用 copliot+claude 3.5 ,效果其实还可以,就是不能插入代码稍微麻烦点
    greygoo
        94
    greygoo  
       29 天前
    @magic3584 #70 功能好像多一点 ui 我更喜欢
    LoLSilence
        95
    LoLSilence  
       29 天前
    @mumbler #50 自己在用 business 的,就是来取经,想具体看看你的场景,方便的话能贴出来看看不
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5497 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 06:13 · PVG 14:13 · LAX 23:13 · JFK 02:13
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.