V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
dudaming
V2EX  ›  问与答

阿里发布 Qwen3Max 性能超 GPT5,全球前三

  •  
  •   dudaming · 1 天前 · 3848 次点击

    刚看新闻,这是真的吗,突然这么厉害 https://t.cj.sina.com.cn/articles/view/1642634100/61e89b7404001jrie

    38 条回复    2025-09-25 16:25:52 +08:00
    dudaming
        1
    dudaming  
    OP
       1 天前
    有没有了解的大佬说说,还是很震惊的
    thedog
        2
    thedog  
       1 天前
    真假都有可能。阿里应该是有这个实力的。不过阿里的 pr 味道很重,也不知道实际测试什么水平。等真出来了,测测就知道了。
    NoobNoob030
        3
    NoobNoob030  
       1 天前
    大概率是真的
    dynastysea
        4
    dynastysea  
       1 天前
    平时日常用 qwen ,gpt5 也用,技术方面 qwen 优势明显,很多技术问题,gpt5 都说的很浅
    xing7673
        5
    xing7673  
       1 天前
    chat 页面上选 qwen3-Max 不支持深度思考,实测的感觉和 instant 模型差不多。

    不知道哪里可以有 thinking 的版本去测试一下
    Meteora626
        6
    Meteora626  
       1 天前
    是 gpt5 太让人失望了,4-5 完全没有体现出实力。Qwen3Max 把参数堆到 t 级 出成果也不意外,看看之前 k2 就是粗暴堆 ds 架构再训练都很不错
    knva
        7
    knva  
       1 天前
    阿里大模型还是没问题的,qwen image 和 wan2.2 都很棒
    coefu
        8
    coefu  
       1 天前
    从 1000 到 10000 的提升,恰恰是我方最擅长的,毋庸置疑。
    fs418082760
        9
    fs418082760  
       1 天前
    中文的 AI 能力害得靠中文训练出来的模型才精准。
    Skifary
        10
    Skifary  
       1 天前
    前三是哪三家🐶
    1una
        11
    1una  
       1 天前
    @Meteora626 堆参数也不是谁都能堆的,还记得 2T 参数的 Llama 4 Behemoth 么?一直延期到现在还没发布
    maolon
        12
    maolon  
       1 天前
    你超了哪个 gpt5 呢?超了 low, medium 还是 high ?这个三个 thinking effort 可是性能天差地别
    全球第三是 chatbot arena 这个现在基本没有参考性的榜
    我不是说 qwen 不行,不如说我一直都在吹 qwen, 但是阿里的稿子还是看看就好
    Parva
        13
    Parva  
       1 天前   ❤️ 4
    同楼上,现在哪家新发一个模型 媒体都是吹得天花乱坠。最后发现还得是 chatgpt+claude
    Rickkkkkkk
        14
    Rickkkkkkk  
       1 天前
    我搜索 chatgpt 链接点开就能用;我搜索 Qwen3Max ,请问?
    hellodigua
        15
    hellodigua  
       1 天前
    woc ,看了标题去试了一下 qwen3-max ,效果真的可以
    Revenant
        16
    Revenant  
       1 天前
    最新版本还没体验过,不过之前版本的 qwen 是 Benchmark 战神,基准没输过,实战没赢过😂,实际体验连 DSv3 都干不过
    june4
        17
    june4  
       1 天前
    @Rickkkkkkk 能上 v2 就别用百度了,官网不是能用吗? https://chat.qwen.ai/
    stinkytofux
        18
    stinkytofux  
       1 天前
    @Rickkkkkkk #14 阿里云百炼上不就有么, 我看到这个帖子就找到了, 还免费. 你不熟是因为你平时不用.

    https://bailian.console.aliyun.com
    Rickkkkkkk
        19
    Rickkkkkkk  
       1 天前
    @june4 你用 google 搜索 Qwen3Max 可以看看前几个结果是啥
    MoozLee
        20
    MoozLee  
       1 天前
    之前的版本,实际使用下一用一个不吱声。
    AutumnVerse
        21
    AutumnVerse  
       1 天前 via iPhone
    以前每次有新模型问世,我都会去尝试一番,现在已经没那个兴趣了,还是 gpt 吧。个个发布会都吹得震天响,真正干活还得 gpt
    june4
        22
    june4  
       1 天前
    @Rickkkkkkk 第一个就是模型的官方发行文档页啊,里面详细介绍了这个模型,以及去哪里用(注明了官方网站版网址和 api 方式用法)
    kangkkk
        23
    kangkkk  
       1 天前
    Qwen3 相关模型是真强,用了有一段时间了。
    Seck
        24
    Seck  
       1 天前 via Android
    哦,我说一下使用感受
    比没上线之前,反正实际效果是好的,这一点毋庸置疑
    就是你经常用阿里 qwen 的话,可以明显体验出来,没上 max 和上 max 过后,有个明显不一样

    但是我不用啊,我只是会在前两名 gemini 以及 GPT5 回答问题实在回答不出来,这个再换一个😂😂😂

    互联网效应,人人都愿意用 top one, top 2 没人记住,何况你这是 top3 ,更没人用🤫🤫🤫
    Seck
        25
    Seck  
       1 天前 via Android
    @AutumnVerse 现在的大模型加入了用户个性化,同一个问题,不同的用户问,也会回答不同的内容。
    你用得越多,越了解你,你越离不开。

    这就是为什么无论你发什么模型,我就用 GPT5🤦‍♂️🤦‍♂️
    clarkethan
        26
    clarkethan  
       22 小时 55 分钟前
    @Meteora626 建议多体验下 GPT-5 的 thinking 或者 pro 模型再下这个结论
    pxlxh
        27
    pxlxh  
       15 小时 34 分钟前 via iPhone
    前面几楼一股怪味儿
    fivee
        28
    fivee  
       14 小时 55 分钟前
    @Rickkkkkkk 你都知道搜 chatgpt 了,都不知道搜 qwen 吗
    byby
        29
    byby  
       14 小时 22 分钟前
    纸面上没输过,体验上没赢过
    gpt5
        30
    gpt5  
       13 小时 49 分钟前
    又是蒸煮 gpt😏
    gechang
        31
    gechang  
       13 小时 11 分钟前
    老板买了 GPT plus 用着还行啊,很多问题一针见血,一条回答就能解决了,其他 AI 得反复问,给报错结果啥的
    lizy0329
        32
    lizy0329  
       13 小时 5 分钟前
    先把 循环思考卡死 修复了,再谈其他的吧
    zhouu
        33
    zhouu  
       12 小时 46 分钟前
    @xing7673 因为 thinking 版本还在训练,发布的就是指令型模型
    Dawnnnnnn
        34
    Dawnnnnnn  
       12 小时 42 分钟前
    你就用吧,一用一个不吱声。
    ludan110
        35
    ludan110  
       12 小时 28 分钟前
    cluade chatgpt 应该是公认的前 2 qwen 都超了这两个的 只写前三太保守了
    donglinjieshi
        36
    donglinjieshi  
       11 小时 51 分钟前
    我还是喜欢 Grok
    xing7673
        37
    xing7673  
       9 小时 51 分钟前
    @zhouu 可以,期待 thinking 的
    mscsky
        38
    mscsky  
       6 小时 26 分钟前
    国产也就跑分在赢,文字处理不如 gemini 一毛
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2714 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 14:52 · PVG 22:52 · LAX 07:52 · JFK 10:52
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.