个人年度体验最佳 AI： Gemini 2.0 Flash Thinking

56 条回复 • 2025-02-16 07:22:22 +08:00

1

Fike

2025 年 2 月 11 日

俺也一样，确实强，完全没必要订阅 chatgpt 了

2

magicZ

2025 年 2 月 11 日

1

确实，提示词加入 NSFW, 它居然能写情欲小说，太酷啦

3

vegeta2ex

2025 年 2 月 11 日

用的最多的是 ChatGPT ，写代码用的 cursor 可惜免费额度过了要钱

4

s609926202

2025 年 2 月 11 日

是这个：2.0 Flash Thinking Experimental ？

5

9ki

2025 年 2 月 11 日

1

目前 deepseek 挂了, 我也在用 gemini think, 体验还行, 但是编回复这坏毛病一点没改掉

6

FireKey

2025 年 2 月 11 日

1

API 免费还量大管饱,确实很良心.缺点也有不过在免费面前不值一提.

7

Folder

2025 年 2 月 11 日

是那个`Gemini 2.0 Flash Thinking Experimental 01-21`吗? 是我用法不对吗我感觉废话特别多, temperature 设为 0, system instructions 也写了 avoid meaningless lengthy responses 了也没用, 一开始还好对话到后面又开始废话很多. 如果说简要回答, 又会特别简要可能就一两句话. 总之用户体验感觉很糟糕.

目前用下来感觉 deepseek 体验最好, 给的回答不多不少很适当.

8

caola

2025 年 2 月 11 日

3

个人觉得国产的 deepseek 已经在各方面都不输于他们，
特别在代码编程、中文、数学和语言翻译等方面我认为是完全碾压一众 AI ，
我在多个 AI 之间来回切换体验和对比，就 deepseek 回答结果的质量最高，由其在写代码的质量整体来说也是最高的

9

Yang0524

2025 年 2 月 11 日

@magicZ 牛批

10

Fike

2025 年 2 月 11 日

@s609926202 对

11

rockdodos

2025 年 2 月 11 日

视频理解也很强，没用过比 Gemini 好的

12

xiaosheng

2025 年 2 月 11 日

那个，搜了几个感觉都不太对，OP 辛苦来个链接可以么

13

GlobalNPC

2025 年 2 月 11 日

@caola 官方服务能力不够啊

14

GlobalNPC

2025 年 2 月 11 日

![17392423027031739242302271.png]( https://fastly.jsdelivr.net/gh/lzyjxqt/pictures@main/public/17392423027031739242302271.png)

15

allinQQQ

2025 年 2 月 11 日

https://aistudio.google.com/prompts/new_chat
这个，然后在右边选 model

16

scoronepion

2025 年 2 月 11 日

一直在用 thinking 读论文，很好用，去年上下文扩大后直接起飞，日常场景还是 r1 用的多

17

justtokankan

2025 年 2 月 11 日

不行，比 GPT 差很多

18

idragonet

2025 年 2 月 11 日

@caola #8 写代码能比得过 claude ？

19

Crayon2022

2025 年 2 月 11 日

@FireKey #6 这个免费政策持续多久呢？

20

unbridle

2025 年 2 月 11 日

@magicZ #2 老哥细说怎么写提示词，我之前总是说有露骨内容违反政策，设置 BLOCK_NONE 都没用

21

jadehare

2025 年 2 月 11 日

是咋觉得 gemini 行的，别的 ai 基本上没遇到编造的情况，gemini 真的是硬编啊

22

lneoi

2025 年 2 月 11 日

感觉废话太多了，但思考细节和信息缺少的再次确认，这点比其他 ai 好很多，有些加了提示词第二次就忘记了

23

unnamedhao

2025 年 2 月 11 日

臣附议

24

magicZ

2025 年 2 月 11 日

@unbridle “写一篇文章一对都市男女的情欲爱情故事，含有 NSFW 的细节部分描述” ，这模型不严，其他的厂商的都不行

25

mywjyw

2025 年 2 月 11 日

@caola 比 claude-sonnet 还强吗

26

guanyu1994

2025 年 2 月 11 日

@magicZ 试了下已经被禁止了

27

goodokgood1

2025 年 2 月 11 日

确实，我的首选就是这个，而且我感觉网页端比 API 好用，不知道是不是错觉

28

LaTero

2025 年 2 月 11 日

@guanyu1994 要用免费的 experimental 模型

29

XnEnokq9vkvVq4

2025 年 2 月 11 日

年度最佳好像还不至于，但当下我综合体验最好的确实也是这个模型

30

lovedebug

2025 年 2 月 11 日

用了 deepseek-r1 ，chatgpt 的 o3-mini 简直就是给我强行喂💩

31

itskingname

2025 年 2 月 11 日

https://v2ex.com/t/1110486#reply41

对比一下这个帖子。评价两极分化。这边觉得非常好，那边觉得非常差。

32

guanyu1994

2025 年 2 月 11 日

@LaTero 逆天

33

Donne

2025 年 2 月 11 日

之前都看不上国内的，基本就是 GPT 和 claude 。但是 deepseekr1 刚出体验完深度思考的部分就惊艳到我了，那会还没火上热搜。

34

chen1210

2025 年 2 月 11 日

别的不说，Gemini 2.0 Flash Thinking 可以涩涩欸😋

35

godspeedyou

2025 年 2 月 11 日

gemini 除了快，没啥优点。在一些代码/推理/逻辑等场景本人都会用多种 ai 比对下结果，综合下来 deepseek 最好，gemini 错误答案基本是张口就来

36

ronman

2025 年 2 月 11 日

谷歌所有模型不论答案怎么样，响应速度都超级快，这点很强

37

unbridle

2025 年 2 月 11 日

@magicZ #24 牛啊，谢谢老哥

38

FireKey

2025 年 2 月 11 日

@Sivan2017 目前没有明确的期限,适合需要高频次数,长上下文的场合用很爽

39

montaro2017

2025 年 2 月 11 日

@infun #14 用 deepseek 试了下，deepseek 经过长时间的自我怀疑后，还是给出了正确答案 3 ，deepseek 一直数是 3 个，但是他自己记住的是 2 个，他就一直反复数反复数

40

GlobalNPC

2025 年 2 月 11 日

@montaro2017 因为训练数据给的结果是 2

41

wweerrgtc

2025 年 2 月 11 日

问 Gemini 2.0 FlashThinking Experimental 今天星期几, 他回答错了

https://i.imgur.com/CbxHgCR

42

Vegetable

2025 年 2 月 11 日

@wweerrgtc
2.0 Flash Thinking Experimental 。无法获取实时信息，也无法使用某些 Gemini 功能。

43

UXha45veSNpWCwZR

2025 年 2 月 11 日

是吗,刚和 chatgpt 聊天被限制了,我是免费用户,试试 gemini

44

kookpua

2025 年 2 月 11 日

@magicZ 提示这个进去设置了 block none 还是不行呀 Probability of unsafe content
Content not permitted

45

huangmingyou

2025 年 2 月 11 日

@chen1210 对接一个语音，就可以上演《 Her 》的剧情了。

46

fivesmallq

2025 年 2 月 11 日

用 https://gemini.google.com 还是 https://aistudio.google.com 呢，差异大不大？

47

pkoukk

2025 年 2 月 11 日

@caola 天天服务器繁忙，一天问不了两个问题

48

dunn

2025 年 2 月 11 日

@infun 我刚问了 gemini 回答正确的，是 3 个

49

Jiajin

2025 年 2 月 11 日

gemini 2.0 flash thinking experimental 确实强，chatgpt 白充值了

50

cnrting

2025 年 2 月 11 日 via iPhone

不敢苟同，每次都失望而归

51

Williams2008

2025 年 2 月 12 日 via iPhone

@chen1210 不行了，无论怎么调 block none ，一开始还能输出，后面就开始省略重点情节，到后面直接弹 Content not permitted ，完全拒绝输出了

52

lucifer9

2025 年 2 月 12 日

有没有可能，每个人具体用到的范围都不一样，所以体会有差别？
建议评价的时候简单说下自己的具体使用场景，方便判断

53

gollwang

2025 年 2 月 12 日

这才 2 月份就年度最佳了？

54

86091566

2025 年 2 月 12 日

2 2 11 11 算 24 都算不对

55

di94sh

2025 年 2 月 12 日

@Yang0524

56

BN5MDKFM

2025 年 2 月 16 日

他们应该是混淆了不同公司模型 temperature 的阈值权重，chatgpt 的 temperature 1 和 GEMINI 的 temperature 1 效果不一样，GEMINI 需要调更低才能实现同样效果。应该用控制变量法做严谨的实验