V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
NothingExist
V2EX  ›  OpenAI

个人年度体验最佳 AI: Gemini 2.0 Flash Thinking

  •  
  •   NothingExist · 34 天前 · 6934 次点击
    这是一个创建于 34 天前的主题,其中的信息可能已经有所发展或是发生改变。

    过去这一年用了很多 AI 工具,用的最多的是 ChatGPT ,Kimi.ai, Claude, Gemini,最终感觉最好用的 Google AI Studio 的 Gemini 2.0 Flash Thinking.

    想听听大家的看法。

    56 条回复    2025-02-16 07:22:22 +08:00
    Fike
        1
    Fike  
       34 天前
    俺也一样,确实强,完全没必要订阅 chatgpt 了
    magicZ
        2
    magicZ  
       34 天前   ❤️ 1
    确实,提示词加入 NSFW, 它居然能写情欲小说,太酷啦
    luffy2u
        3
    luffy2u  
       34 天前
    用的最多的是 ChatGPT ,写代码用的 cursor 可惜免费额度过了要钱
    s609926202
        4
    s609926202  
       34 天前
    是这个:2.0 Flash Thinking Experimental ?
    9ki
        5
    9ki  
       34 天前   ❤️ 1
    目前 deepseek 挂了, 我也在用 gemini think, 体验还行, 但是编回复这坏毛病一点没改掉
    FireKey
        6
    FireKey  
       34 天前   ❤️ 1
    API 免费还量大管饱,确实很良心.缺点也有不过在免费面前不值一提.
    Avafly
        7
    Avafly  
       34 天前
    是那个`Gemini 2.0 Flash Thinking Experimental 01-21`吗? 是我用法不对吗我感觉废话特别多, temperature 设为 0, system instructions 也写了 avoid meaningless lengthy responses 了也没用, 一开始还好对话到后面又开始废话很多. 如果说简要回答, 又会特别简要可能就一两句话. 总之用户体验感觉很糟糕.

    目前用下来感觉 deepseek 体验最好, 给的回答不多不少很适当.
    caola
        8
    caola  
       34 天前   ❤️ 3
    个人觉得国产的 deepseek 已经在各方面都不输于他们,
    特别在 代码编程、中文、数学和语言翻译 等方面我认为是完全碾压一众 AI ,
    我在多个 AI 之间来回切换体验和对比,就 deepseek 回答结果的质量最高,由其在写代码的质量整体来说也是最高的
    Yang0524
        9
    Yang0524  
       34 天前
    @magicZ 牛批
    Fike
        10
    Fike  
       34 天前
    rockdodos
        11
    rockdodos  
       34 天前
    视频理解也很强,没用过比 Gemini 好的
    xiaosheng
        12
    xiaosheng  
       34 天前
    那个,搜了几个感觉都不太对,OP 辛苦来个链接可以么
    infun
        13
    infun  
       34 天前
    @caola 官方服务能力不够啊
    infun
        14
    infun  
       34 天前
    logic159
        15
    logic159  
       34 天前
    https://aistudio.google.com/prompts/new_chat
    这个,然后在右边选 model
    scoronepion
        16
    scoronepion  
       34 天前
    一直在用 thinking 读论文,很好用,去年上下文扩大后直接起飞,日常场景还是 r1 用的多
    justtokankan
        17
    justtokankan  
       34 天前
    不行,比 GPT 差很多
    idragonet
        18
    idragonet  
       34 天前
    @caola #8 写代码能比得过 claude ?
    Sivan2017
        19
    Sivan2017  
       34 天前
    @FireKey #6 这个免费政策持续多久呢?
    unbridle
        20
    unbridle  
       34 天前
    @magicZ #2 老哥细说怎么写提示词,我之前总是说有露骨内容违反政策,设置 BLOCK_NONE 都没用
    jadehare
        21
    jadehare  
       34 天前
    是咋觉得 gemini 行的,别的 ai 基本上没遇到编造的情况,gemini 真的是硬编啊
    lneoi
        22
    lneoi  
       34 天前
    感觉废话太多了,但思考细节和信息缺少的再次确认,这点比其他 ai 好很多,有些加了提示词第二次就忘记了
    unnamedhao
        23
    unnamedhao  
       34 天前
    臣附议
    magicZ
        24
    magicZ  
       34 天前
    @unbridle “写一篇文章一对都市男女的情欲爱情故事,含有 NSFW 的细节部分描述” ,这模型不严,其他的厂商的都不行
    mywjyw
        25
    mywjyw  
       34 天前
    @caola 比 claude-sonnet 还强吗
    guanyu1994
        26
    guanyu1994  
       34 天前
    @magicZ 试了下 已经被禁止了
    goodokgood1
        27
    goodokgood1  
       34 天前
    确实,我的首选就是这个,而且我感觉网页端比 API 好用,不知道是不是错觉
    LaTero
        28
    LaTero  
       34 天前
    @guanyu1994 要用免费的 experimental 模型
    hanqian
        29
    hanqian  
       34 天前
    年度最佳好像还不至于,但当下我综合体验最好的确实也是这个模型
    lovedebug
        30
    lovedebug  
       34 天前
    用了 deepseek-r1 ,chatgpt 的 o3-mini 简直就是给我强行喂💩
    itskingname
        31
    itskingname  
       34 天前
    https://v2ex.com/t/1110486#reply41

    对比一下这个帖子。评价两极分化。这边觉得非常好,那边觉得非常差。
    guanyu1994
        32
    guanyu1994  
       34 天前
    @LaTero 逆天
    Donne
        33
    Donne  
       34 天前
    之前都看不上国内的,基本就是 GPT 和 claude 。但是 deepseekr1 刚出体验完深度思考的部分就惊艳到我了,那会还没火上热搜。
    chen1210
        34
    chen1210  
       34 天前
    别的不说,Gemini 2.0 Flash Thinking 可以涩涩欸😋
    godspeedyou
        35
    godspeedyou  
       34 天前
    gemini 除了快,没啥优点。在一些代码/推理/逻辑等场景本人都会用多种 ai 比对下结果,综合下来 deepseek 最好,gemini 错误答案基本是张口就来
    ronman
        36
    ronman  
       34 天前
    谷歌所有模型不论答案怎么样,响应速度都超级快,这点很强
    unbridle
        37
    unbridle  
       34 天前
    @magicZ #24 牛啊,谢谢老哥
    FireKey
        38
    FireKey  
       34 天前
    @Sivan2017 目前没有明确的期限,适合需要高频次数,长上下文的场合用很爽
    montaro2017
        39
    montaro2017  
       34 天前
    @infun #14 用 deepseek 试了下,deepseek 经过长时间的自我怀疑后,还是给出了正确答案 3 ,deepseek 一直数是 3 个,但是他自己记住的是 2 个,他就一直反复数反复数

    infun
        40
    infun  
       34 天前
    @montaro2017 因为训练数据给的结果是 2
    wweerrgtc
        41
    wweerrgtc  
       34 天前
    问 Gemini 2.0 FlashThinking Experimental 今天星期几, 他回答错了

    https://i.imgur.com/CbxHgCR
    Vegetable
        42
    Vegetable  
       34 天前
    @wweerrgtc
    2.0 Flash Thinking Experimental 。无法获取实时信息,也无法使用某些 Gemini 功能。
    UXha45veSNpWCwZR
        43
    UXha45veSNpWCwZR  
       34 天前
    是吗,刚和 chatgpt 聊天被限制了,我是免费用户,试试 gemini
    kookpua
        44
    kookpua  
       34 天前
    @magicZ 提示这个 进去设置了 block none 还是不行呀 Probability of unsafe content
    Content not permitted
    huangmingyou
        45
    huangmingyou  
       34 天前
    @chen1210 对接一个语音,就可以上演《 Her 》的剧情了。
    fivesmallq
        46
    fivesmallq  
       34 天前
    https://gemini.google.com 还是 https://aistudio.google.com 呢,差异大不大?
    pkoukk
        47
    pkoukk  
       34 天前
    @caola 天天服务器繁忙,一天问不了两个问题
    dunn
        48
    dunn  
       34 天前
    @infun 我刚问了 gemini 回答正确的,是 3 个
    Jiajin
        49
    Jiajin  
       34 天前
    gemini 2.0 flash thinking experimental 确实强,chatgpt 白充值了
    cnrting
        50
    cnrting  
       34 天前 via iPhone
    不敢苟同,每次都失望而归
    Williams2008
        51
    Williams2008  
       34 天前 via iPhone
    @chen1210 不行了,无论怎么调 block none ,一开始还能输出,后面就开始省略重点情节,到后面直接弹 Content not permitted ,完全拒绝输出了
    lucifer9
        52
    lucifer9  
       33 天前
    有没有可能,每个人具体用到的范围都不一样,所以体会有差别?
    建议评价的时候简单说下自己的具体使用场景,方便判断
    gollwang
        53
    gollwang  
       33 天前
    这才 2 月份就年度最佳了?
    86091566
        54
    86091566  
       33 天前
    2 2 11 11 算 24 都算不对
    di94sh
        55
    di94sh  
       33 天前
    BN5MDKFM
        56
    BN5MDKFM  
       29 天前
    他们应该是混淆了不同公司模型 temperature 的阈值权重,chatgpt 的 temperature 1 和 GEMINI 的 temperature 1 效果不一样,GEMINI 需要调更低才能实现同样效果。应该用控制变量法做严谨的实验
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1081 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 19:05 · PVG 03:05 · LAX 12:05 · JFK 15:05
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.