V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
wsbqdyhm
V2EX  ›  程序员

Gemini 3 Flash 用着挺香,但想找个更便宜的替代

  •  
  •   wsbqdyhm · 11 小时 53 分钟前 · 2115 次点击
    最近在折腾 OpenClaw (小龙虾)+ n8n 工作流 做一些自动化任务,现在主要是薅 Google 的 $300 API credit 。

    主力模型用的是 Gemini 3 Flash ,整体体验挺好,速度快、工具调用也稳,基本能顶住日常 workflow 。不过 Gemini 3.1 Pro 有调用限额,所以很多任务还是得靠 Flash 。

    现在的问题是:
    想找一个 性能大致对标 Gemini 3 Flash ,但更有性价比的模型 做备用 / 分流。

    另外我本地也有一张 4090 ,所以也在考虑顺便搞个 本地模型做 fallback ,简单任务或者离线的时候用。

    在各大主流 ai 问了一圈,投票如下:

    云端模型(对标 Gemini 3 Flash )

    Kimi K2.5-K2 ( 4 票)

    DeepSeek R1 / V3.2 ( 1 票)

    本地部署( 4090 )

    DeepSeek-R1-Distill-Qwen-32B ( 4bit )( 3 票)

    GLM-4.7-Flash ( 30B A3B MoE )( 2 票)

    目前的思路大概是:

    主力:Gemini 3 Flash

    云端备用:Kimi / DeepSeek

    本地:跑一个 30B 左右模型兜底

    不过我自己还没实际长期跑过这些组合,所以想听听大家的真实使用经验:

    Kimi K2.5 和 DeepSeek V3 / R1 实际体验怎么样?

    有没有 性价比能接近 Gemini 3 Flash 的模型?

    4090 本地模型现在比较稳的是不是还是 32B 这一档?

    欢迎拍砖,主要想听听长期在用的经验。
    22 条回复    2026-03-12 22:17:59 +08:00
    superkkk
        1
    superkkk  
       11 小时 49 分钟前
    千问 3.5 35B A3B 或者千问 coder next ,这俩还行,但是毕竟免费开源的,24g 显存可能不够
    liu731
        2
    liu731  
    PRO
       11 小时 42 分钟前
    比它聪明的没它快,比它快的没它聪明
    wsbqdyhm
        3
    wsbqdyhm  
    OP
       11 小时 36 分钟前
    @liu731 2.5flash 体验怎么样? 之前用了一下 2.5 pro 弱智一样。
    skyemin
        4
    skyemin  
       11 小时 34 分钟前
    $300 API 现在还送吗
    liu731
        5
    liu731  
    PRO
       11 小时 33 分钟前
    @wsbqdyhm 简单任务(<=5K Token )还不错。复杂任务不行
    wsbqdyhm
        6
    wsbqdyhm  
    OP
       11 小时 24 分钟前
    @skyemin 送的,但有各种限额。用 3.1p 一不小心就⚠️ API rate limit reached. Please try again later.
    chungon
        7
    chungon  
       11 小时 24 分钟前
    这个我也没找到替代,国产的试了一圈都没有它好用
    resist
        8
    resist  
       11 小时 15 分钟前
    模型我认为目前好用的就是 gemini 和 chatgpt ,其他的都差点意思
    eGlhb2Jhb2Jhbw
        9
    eGlhb2Jhb2Jhbw  
       10 小时 57 分钟前
    今天试了下本地部署 QWen3.5 35B-A3B 可用度很高,https://pinchbench.com/ 上评分超过了 gemini-3-flash-preview
    FengMubai
        10
    FengMubai  
       10 小时 53 分钟前
    3.1 lite
    v2gba
        11
    v2gba  
       10 小时 49 分钟前
    3 flash 跑一天大概多少花费?
    skyemin
        12
    skyemin  
       10 小时 46 分钟前
    @wsbqdyhm 咋操作呀 可以的话我也弄一下
    HaibaraDP
        13
    HaibaraDP  
       10 小时 38 分钟前
    3.1 lite
    xiafengjieying
        14
    xiafengjieying  
       9 小时前 via iPhone
    3.1pro 有调用 api 么?
    wsbqdyhm
        15
    wsbqdyhm  
    OP
       8 小时 13 分钟前 via iPhone
    @xiafengjieying #14 有 3.1 预览版,250 次一天
    wsbqdyhm
        16
    wsbqdyhm  
    OP
       8 小时 12 分钟前 via iPhone
    @skyemin #12 直接卡验证就行,v 卡双币的好像不行,我用的招行万事达可以,
    wsbqdyhm
        17
    wsbqdyhm  
    OP
       8 小时 12 分钟前 via iPhone
    @eGlhb2Jhb2Jhbw #9 4090 能跑不
    Cusox
        18
    Cusox  
       7 小时 27 分钟前
    $300 大概能用多久
    zyqbit
        19
    zyqbit  
       7 小时 9 分钟前
    @Cusox #18 我记得好像是 90 天有效期
    NakanoAzure
        20
    NakanoAzure  
       4 小时 40 分钟前
    现在还能白嫖 api 吗,是不是多注册几个白嫖就行?
    Deshun
        21
    Deshun  
       4 小时 26 分钟前 via Android
    Dear Developer,
    Our review of your Gemini API activity indicates that your project Agent (id: gen-lang-client-0107) is using Gemini API in a manner that violates both the Gemini API Additional Terms of Service and the broader Google APIs Terms of Service for the Google API you are using. As a result of this violation, we have restricted your access to the corresponding APIs.
    You may respond to this decision by submitting an appeal. Please note that you should be logged in as the project owner to access the appeals page.
    Please take a moment to also review the Google APIs Terms of Service, the Gemini API Additional Terms of Service, and the Generative AI Prohibited Use Policy applicable to Gemini API so that you do not violate our terms and policies in the future.
    Deshun
        22
    Deshun  
       4 小时 25 分钟前 via Android
    @Cusox 一天
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1073 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 18:43 · PVG 02:43 · LAX 11:43 · JFK 14:43
    ♥ Do have faith in what you're doing.