前言: 针对坛友 bot 部署中常讨论的 Token 成本与模型智障问题,分享基于我的低成本(纯白嫖)接入方案。本文仅讨论技术实现与体验差异,不涉及推广。
一、API 方案(不推荐):高延迟与低可用性的妥协 API 接入虽然标准,但在“白嫖”或低成本层级下,体验往往受限于 RPM (Requests Per Minute) 和推断速度。
1.NVIDIA NIM (GLM-4.7-Flash): 规格: 免费层提供 GLM-4.7 ,理论性能不错。 实测: 限制 40 RPM 。最大的问题是延迟( Latency ),推断队列极长,导致 Agent 响应迟钝。 结论: 仅适合作为 fallback 或低频任务备用。
2.其他备选: Google AI Studio: 免费层可用,但风控严格。 Modelscope (魔搭):听说还行,没用过。 SiliconFlow (硅基流动): 免费额度甚至不如本地量化模型实用,Pass 。
二、OAuth (你可以白嫖的订阅):我认可的目前的最优解 通过模拟用户会话( OAuth/Cookie )接入,通常能获得该模型满血版的推理能力和更大的上下文窗口。
1.Gemini (Google CLI / Anti-Gravity)
推荐指数: ⭐⭐⭐⭐⭐
接入方式: openclaw 原生支持 Google cli + 反重力 (AntiGravity) 接入。
优势: 智商在线: 完整的 Flash/Pro 体验,非阉割版,还有 Claude opus/sonnet 。 额度池: Flash 与 Pro 额度独立计算。 家庭组策略: 一个主号可开 5 个家庭组子号,配合 OpenClaw 的轮询策略( Round-Robin ),理论上可获得 6 账号 * ((Flash + Pro)*2+Claude) = 30 独立额度,叠加 5h 刷新的 flash ,可以说是其实单账号也是怎么也用不完的逆天额度。 状态: 目前 Edu 邮箱依然存活,建议自行解决账号源,勿通过二手渠道(高风险)。
2.Qwen (海外版)
推荐指数: ⭐⭐⭐⭐
优势: 注册即用,无门槛,openclaw 原生支持。
缺点: 朋友推荐,我没实测。
3.OpenAI (ChatGPT)
推荐指数: ⭐⭐⭐⭐
依然 openclaw 原生支持,本来肯定想放第二位推荐,但白嫖车已开走,适用已订阅用户。
策略: 适合作为 Coding 任务的主力( Gemini 在代码生成的准确性上仍逊于 GPT-5.3-codex )。 免费层额度每周重置,适合高强度突击使用 2-3 天,不适合 7x24 小时挂机,更别拿来挂 heartbeat 。
三、 建议与实操体验 模型路由 (Router): 建议日常对话/总结接 Gemini ,写代码上 codex 或者反重力的 claude 。
权限警示: OpenClaw 作为一个拥有本地 Shell 读写权限的 Agent ,其安全性完全依赖于模型的指令遵循能力。基模( Base Model )智商过低会导致指令误读,进而误删文件或执行错误脚本。
长期使用建议建立 .md 格式的 Memory/Todo/workflow 体系(我自己又加了给人看的日记 journal 和实用手册)。实测 Gemini 拟人化、全能任务最强,基本能达到“伴生助手”的体验。(最舍不得的是白嫖额度实在太 tm 够用了)
真实经验+AI 润色,欢迎补充
1
Cola90 12 小时 23 分钟前 via iPhone
这就将帖子转发给我的 claw 看看
|
3
Tink PRO 我 antigravity 挂了 openclaw 三天被封了,状态是网页可以用,antigravity 喝 gemini cli 无法使用
|
4
freedomli 11 小时 28 分钟前 via iPhone
正想折腾 Gemini ,看到 3 楼说的不敢弄了
|