V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
RealVic
V2EX  ›  Google

Gemini Advanced 使用体验(对比 GPT-4 API)

  •  1
     
  •   RealVic · 266 天前 · 4098 次点击
    这是一个创建于 266 天前的主题,其中的信息可能已经有所发展或是发生改变。

    Gemini Advanced 目前使用的是 Gemini Ultra 1.0 模型,新闻里更 X 的 1.5 还没更新(至少目前是这样)。

    根据我日常高强度的使用体验,感觉到在英文方面,Gemini Advanced 是比 GPT-4 API (带联网等一大堆模块)体验更顺畅的,基本上许多问题,Gemini Advanced 速度都比 GPT-4 更快。

    一些只有 GPT-4 能回答的问题,比如钢丝球炒鸡蛋这种,如果用中文询问 Gemini Advanced ,那绝对翻大车,和 GPT-3.5 一个水平,但是如果先翻译成英文,再询问就是完全没问题的,这也侧面证明了 Gemini Advanced 完全没有针对中文优化过。

    多模态方面,图片识别两者的能力差不多。

    但是 Gemini Advanced 生成图片的准确度、达标度是远远超过 GPT-4 的 DALL-E 3 ,比如我们要求画一张「瑞克和莫蒂」的图片,GPT-4 会忌惮版权问题乱画一通,但是 Gemini Advanced 是完全没有这个问题,画得非常符合要求。

    当然,这一点我的判断是 OpenAI 自己限制的,因为同样采用 DALL-E 3 的 Microsoft Copilot 也和 Gemini Advanced 一样可以画出任何东西,不受版权限制。

    目前,Gemini Advanced 在 iOS 上没有独立 App ,需要在 Google App 中等待滚动推送,所以我在安卓手机上下了一个,原生 App 的体验还不错,相比 OpenAI ,Gemini Advanced 在 UI 上更认真。

    总结一下 Gemini Advanced 的优缺点:

    优点:

    1. 英文对话体验基本达到业界标杆 GPT-4 的水平,部分情况下甚至更快。
    2. 图片识别大部分情况下准确,能够准确识别图片中的汉字。
    3. 绘画功能听从用户要求。

    缺点:

    1. 没有对中文进行优化。
    2. iOS 没有原生 App 。
    3. 图片识别偶然情况下,会出现过度推理的问题,推理出图片不存在的细节。

    综合评价

    价格降低到 20 美元的一半,也就是 10 美元,会比较有竞争力。

    20 条回复    2024-02-25 02:16:30 +08:00
    ohellohell
        1
    ohellohell  
       266 天前
    开放 1.5 ,价格降到 10 美金,比较有竞争力
    RealVic
        2
    RealVic  
    OP
       266 天前
    @ohellohell #1 我也是这么想的,这样就算是英文,我也觉得可以在欧美市场和 GPT-4 分庭抗礼
    fulajickhz
        3
    fulajickhz  
       266 天前
    这种图片能不能画,要求 y=x^2+3 ,定义域在 3 ,15
    YUX
        4
    YUX  
       266 天前   ❤️ 1
    一开始闲聊的时候无意中透露我也订阅了 chatgpt plus ,Gemini Advanced 一直让我帮他问 chatgpt 问题,然后把回答贴过来。最开始问了一下 LLM 一些新进展的看法,然后就是一些我也没太看懂的内容。
    capgrey
        5
    capgrey  
       266 天前
    同感,速度更快。这对我来说体验很好
    Biggoldfish
        6
    Biggoldfish  
       266 天前 via Android
    这 20 刀还是附赠了 2TB Google Drive 空间以及 AI 可用于 Google Workspace 的
    Liftman
        7
    Liftman  
       266 天前
    @fulajickhz 你这种跟画图没有关系。实际上是看模型是否多模态支持代码运行。gemini 是不可以的。因为不具有相关执行能力。只能写。不能跑。gpt 里面可以调用 wolfram 插件或者用 py 的数学和图形库执行得到最终的图片导出给你。
    Qinsher
        8
    Qinsher  
       266 天前 via Android
    @YUX 硅竞😂😂
    hanqian
        9
    hanqian  
       266 天前
    还有一点是我用下来“人文”方面 Gemini Advanced 比 GPT-4 强,无论是创意、写作还是问一些社科问题

    然后我 iOS Google App 至今没有 Gemini 界面,气死了。
    RealVic
        10
    RealVic  
    OP
       266 天前 via iPhone
    @Biggoldfish 但是对苹果生态用户来说,20 美元给 Gemini advanced 和 youtube 会员,我觉得更有吸引力
    RealVic
        11
    RealVic  
    OP
       266 天前 via iPhone
    @hanqian 用 safari 吧,还能用翻译插件,解决英文交互问题
    9i5NngJHI4P7dm42
        12
    9i5NngJHI4P7dm42  
       266 天前
    Gemini 的党性太高了, Advanced 怎么样?
    WinG
        13
    WinG  
       266 天前
    1.5 好像支持百万级别的 token? 那 20 美刀的话挺划算的
    fulajickhz
        14
    fulajickhz  
       266 天前
    @Liftman 我也知道调用库

    我的意思是目前所谓的 AI 能否具备根据 prompt 来生成,不需要准确,起码大差不差的图片

    雪地上的猛犸象能画

    为什么 y=x^2 不能画

    是因为训练数据里没这种函数图象吗? 为什么在这个任务上,智能没有起到作用?

    人能分辨函数图象和雪地上的猛犸象,为什么 AI 不行?
    RealVic
        15
    RealVic  
    OP
       265 天前
    @fulajickhz #14 y=x^2 智谱可以画,这个本质上不是什么难事,只要把 y=x^2 用 Python 表达出来,然后根据代码生成图像就可以了,相当于帮你写个 MATLAB 运算
    andrew2558
        16
    andrew2558  
       265 天前
    @RealVic 请问怎么开通的,我开通提示:
    Sorry, Gemini Advanced isn't available for you
    Gemini Advanced is not yet available in some countries, for work accounts, or for users under a certain age.
    请问应该怎么操作?
    Liftman
        17
    Liftman  
       265 天前
    @fulajickhz 那如果你要差不多的话,是可以画的。。。gemini 可以生成类似的函数图。但是只能说是像某个函数的函数图。。但是肯定不是这个准确的函数图。。。因为

    1.他的训练集里面没有全天下所有的函数图。这也不可能做到。毕竟函数的精度是无限的,可能性也是无限的。
    2.函数图可以作为他的训练内容。但是是作为一个整体的。不管什么函数图。他都可能认为是同一个东西。
    3.这些所有的文生图模型都是模拟的视觉成像。

    总之你可以理解为。。生图的过程是开始有一个大概的模糊的样子。然后慢慢扩散成清晰的图片。但是扩散的过程充满了随机性。但是整体趋势是被模型训练过的内容进行控制的。。。一句话就是。文生图=尽可能的长得像仅此而已。
    RealVic
        18
    RealVic  
    OP
       265 天前 via iPhone
    @andrew2558 用美国付款资料就可以了
    mixz
        19
    mixz  
       265 天前
    请教个问题,gemini 的 api 是支持联网搜索的吗?
    stimw
        20
    stimw  
       265 天前 via Android
    我觉得速度快是不是可能,有一部分原因是,没完全开放使用。。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   992 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 21:51 · PVG 05:51 · LAX 13:51 · JFK 16:51
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.