V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  ludyleocn  ›  全部回复第 1 页 / 共 7 页
回复总数  140
1  2  3  4  5  6  7  
告诉你一个好的办法,他们的网站举报一下,直接上墙。
又学到东西了。
plus 和 pro 公用额度池了,上个月 X5 ,这个月直接关了。
5 天前
回复了 cxd8190102 创建的主题 Claude Claude Opus 4.8 来了,但它说它是 qwen
@lance07 气急败坏破防拉黑了?真是笑死我了。

既然你说不需要我科普 Hinton ,那你之前在 101 楼装什么大聪明质问“用语料不算蒸馏那你解释一下开源模型怎么蒸馏闭源模型”?这不就是你自己技术狗屁不通、连基本概念都没搞懂才问出来的弱智问题吗?怎么,被打脸打肿了,又开始吹嘘自己早就知道了?
被事实和逻辑抽得满地找牙,憋了四天憋不出一句有逻辑的反驳,最后只能发明一个“你是 AI 人机”的脑瘫借口来强行挽尊。原来现在论据完整、逻辑清晰在你的认知里叫像个 AI ,那你那坨错字连篇、情绪失控的脏话确实是纯天然人类脑残的结晶了。
甩下一句泼妇骂街式的脏话,然后火速拉黑,深怕我再回你。这种打不过就塞耳塞、骂完人就缩回王八壳里的拉黑遁,真是把底层懦夫的软弱表现得淋漓尽致。
你这杂种也就这点出息了。看看你那可怜的身世,被资助了几年读个书出来,结果脑子什么都学不会。专业能力烂到连大厂校招都过不去,只能天天抱着面试八股文死记硬背。年纪轻轻就落得一身病,不是手腕酸痛就是颈椎要坏,活脱脱一个底层废柴。自己稀烂的能力搞不定开发,号被封了就跑到这儿来无能狂怒,把你的私人怨气和垃圾情绪带到技术社区。你这种高不成低不就的失败者,最应该对你这稀烂的专业能力和卑微的处境感到悲哀,而不是在这儿靠着拉黑、捂住耳朵大喊我不听、你是人机来获得最后的精神胜利。真是一出完美的赛博现眼记。
5 天前
回复了 cxd8190102 创建的主题 Claude Claude Opus 4.8 来了,但它说它是 qwen
@lance07 另外,自己没能力就别学人家去折腾 Claude 注册起号搞开发。号被封了就跑到这儿来无能狂怒,把你的私人怨气和垃圾情绪带到这儿来,这可绝对不是技术圈该有的态度。说真的,你最应该对你自己那稀烂的专业能力和身份感到悲哀,而不是在这儿指点江山。
5 天前
回复了 cxd8190102 创建的主题 Claude Claude Opus 4.8 来了,但它说它是 qwen
@lance07 还有,你这种毫无逻辑的杂种以后少在我评论底下叫唤,也别再回复我了。我的时间贵得很,天天给你们这种连基本常识和法律概念都理不清的低智商人群做弱智科普,可不是我的日常工作。多回你这种人一个字,都是在拉低我自己的智商和时间价值。建议你和你全家以后多去看看弱智短视频和自媒体营销号,每天抱着这些降智垃圾在床上意淫高潮就行,别跑出来污染技术社区。识相点就自己滚远点,别再出来丢人现眼了。
5 天前
回复了 cxd8190102 创建的主题 Claude Claude Opus 4.8 来了,但它说它是 qwen
@lance07 被科普得挂不住脸了就开始撒泼打滚是吧?

当初扯着嗓子质问“用语料不算蒸馏那你解释一下开源模型怎么蒸馏闭源模型”的是你,等我把 Hinton 的论文和伯克利的论文甩你脸上,把 KD 、SFT 和 ToS 的技术法律边界给你划得一清二楚了,你又缩回去耍赖说“没人跟你扯蒸馏的定义,现在谁当是以前那套”。合着一个学术名词什么定义,全看你今天嘴硬的程度?

开源模型本来就是遵循开源协议完全开放的,全球任何人都能合法合规地拿来做训练。但那三家是被逮住注册了两万四个欺诈账号、违规翻墙白嫖了上千万次闭源 API 的现行。一个合法合规用开源,一个用欺诈手段违规白嫖闭源数据,在你嘴里这叫“互相搞语料,A 没违法但就是婊子”?这流氓逻辑简直搞笑。小偷去抢便利店被店主报警抓了,小偷还要跳脚骂“大家都在互相拿东西,你店主凭啥报警?你店主没违法但你就是个婊子”。你这不叫有立场,你这纯属是智商和三观都有硬伤。

最后还整出个“立场和战争”的双头堵闭环来给自己挽尊。在你的脑回路里,反正事实不重要,法律不重要,技术更不用懂,只要辩不过了就扣个“立场”的帽子,好让自己立于不败之地。

承认自己技术不懂、法理不通、逻辑崩塌有这么难吗?非要用这种最降智的狡辩来给自己找台阶下,除了再次证明你在这论坛里确实在裸奔,还有半点用吗?说实话,真不知道你这种贱种这几年书是怎么读的,被资助了几年出来,结果到头来脑子还是什么都学不会。除了缩在角落复读你那点廉价情绪,你还能干点什么?
11 天前
回复了 my2492 创建的主题 Claude 用机房 ip 封号概率高吗?
跟 ip 性质无关,但是之前很多拿来蒸馏的公司,用的都是小鸡 ip 都被记录成非法 ip 。如果你是五六年前买的 aws 、甲骨文,大概没事,或者五六年的小鸡都是的。
11 天前
回复了 fallimmortal 创建的主题 OpenAI OpenAI 提升账号风控警告!
我目前是 3 个 pro+偶尔买的 json 几个一天日抛,通过 cpa+crs 给办公室用。3 个 pro 是自己的账号和手机,买个美国手机不贵,退一万步来说找个 esim 手机下载 giffgaff ,做这行的怎么都要研究一下海外身份。
13 天前
回复了 cxd8190102 创建的主题 Claude Claude Opus 4.8 来了,但它说它是 qwen
@aarontian 我上面的回复确实情绪过重了,这里心平气和地把技术概念和背后的事情理一下。

首先是概念问题。很多人把"合成数据( Synthetic Data )"和"知识蒸馏( Knowledge Distillation )"混为一谈,但这俩在学术上完全是两回事。知识蒸馏( KD )是 Hinton 2015 年提出的,核心是让学生模型对齐教师模型的概率分布( Logits ),通过 KL 散度来传递"暗知识"。而用一个模型的输出文本去做 SFT ,学术上叫合成数据训练或模仿学习( Imitation Learning ),学到的主要是风格和格式,并不等于真正意义上的 KD 。

回到 Anthropic 那篇博文,它指控的那三家通过 API 大量获取 Claude 的输出文本,用来做训练数据。但你想想,通过 API 你拿到的只是最终的文本输出,又不是模型的 Logits 分布,严格来说这些公司做的应该是合成数据训练居多,至少不是每家都在做学术意义上的蒸馏。Anthropic 自己文章里也承认 "Distillation is a widely used and legitimate training method",它真正指控的是注册 24000 个欺诈账号、绕过区域限制、违反 ToS 的行为——这本质是合同违约问题。但它偏偏在标题里造了个 "distillation attacks" 的词,把一个合同纠纷包装成了技术安全事件。

为什么要这么包装?结合它文章里反复提到的 "national security""export controls""authoritarian governments" 这些关键词,意图其实已经很明显了:这篇文章的受众不是技术社区,而是华盛顿的政策制定者。表面上是 ToS 维权,实际上是在游说国会加强对中国 AI 公司的限制,本质是商业竞争手段。把"用我的 API 输出做训练"说成"蒸馏攻击",听起来就像网络安全威胁,更容易推动立法和制裁。

至于 Claude 出现自称 Qwen 的情况,大概率是预训练语料混入了简中合成数据没清洗干净,在没有 system prompt 锚定身份时触发了身份幻觉。这是数据清洗的工程问题,不等于在"蒸馏千问"。反过来同理,之前国产模型出现类似情况也不能直接定性为蒸馏。

大家嘲讽 Anthropic 的回旋镖我完全理解,毕竟是它自己先把这个词武器化的。但如果我们自己也跟着用不精确的概念去起哄,某种程度上反而是在帮 Anthropic 巩固它那套叙事——默认了"用 API 输出做训练 = 蒸馏 = 攻击"这个逻辑链条。
5 月 31 日
回复了 burnbrid 创建的主题 分享创造 我把 @MaxSoloware 做的傻逼模拟器复活了!
他这个站点,3 年,0 权重?
5 月 31 日
回复了 huluwa561 创建的主题 程序员 大佬们 vibe coding 的项目怎么样了
@teaguexiao 说的是的,目前 80 个项目平均一天只能进 1 的 ads 收入,有点尴尬。而且还没开始做 mvp 产品,backlinks 也还没这个打算。得过且过了。。。
5 月 31 日
回复了 VibeCoder 创建的主题 Codex [通知] Codex 明早重置额度,上号,/fast 开蹬了
“哎哟,谢天谢地”
/reboot
5 月 31 日
回复了 cxd8190102 创建的主题 Claude Claude Opus 4.8 来了,但它说它是 qwen
@abc0123xyz 人家在科普的时候你说人家双标,先给人家扣帽子,完整的技术链自己是一个不懂。我几个运营产品都没加身份识别,有时候客户会问我为什么会 ds 提示 3.5 (现在也是,因为我 prompt 就是纯英的)。我建议你这个论坛就别呆了,拉低智商。
5 月 31 日
回复了 cxd8190102 创建的主题 Claude Claude Opus 4.8 来了,但它说它是 qwen
@lance07
先给你补补课,免得你连自己在讽刺什么都搞不清楚。资料都在这里:
关于「 A 也蒸了」的技术事实:
Hinton 2015 知识蒸馏奠基论文: https://arxiv.org/abs/1503.02531 —— KD 需要对齐 Teacher 的 Logits 概率分布计算 KL 散度,不是拿文本跑 SFT 就叫「蒸馏」
UC Berkeley 2023 《 The False Promise of Imitating Proprietary LLMs 》: https://arxiv.org/abs/2305.15717 —— 用 API 输出文本做微调叫 Imitation Learning ,模型只学会风格没学会推理,跟 KD 有本质区别
Anthropic 自家通告: https://www.anthropic.com/news/detecting-and-preventing-distillation-attacks —— 第二段写着 "Distillation is a widely used and legitimate training method",指控的核心是 24000 个欺诈账户违反 ToS ,不是「蒸馏」本身违法
关于「 A 先跳脚/先扯屁股」的事实:
三家公司是被抓了 24000 个欺诈号 + 1600 万次白嫖的现行,A 家连 IP 带高管名字点名
A 家训练语料里出现千问文本:Qwen 是 Apache 2.0 完全开源,任何人可以合法下载使用。这跟欺诈注册 + 绕过区域限制去白嫖闭源 API ,在法律上根本不是一个性质的问题
你把「用合法开源数据训练但不小心混进脏数据」和「注册两万多个假账号翻墙偷 API 」画等号,这叫类比能力灾难
现在说说你这个人。
你只有一句话,但这句话里塞了三个互相矛盾的默认前提,全部自己打自己脸:
逻辑失败: 你的讽刺要成立,必须默认「 A 确实在蒸馏」。但你自己站的那一派(回旋镖派)的核心叙事恰恰是「不是蒸馏只是语料污染/大惊小怪」。你同时踩在两块打架的板子上,左腿说往东右腿说往西,自己不觉得劈叉疼吗?
知识失败: 开源协议和闭源 ToS 分不清,KD 和 SFT 分不清,欺诈和数据污染分不清。三个最基本的概念边界没有一个搞对,就敢出来写讽刺句子。你这不叫有立场,这叫连自己要讽刺的对象是什么都没搞懂就急着站队。
叙事失败: 你的那句话本质上是在说「 A 掠夺了我们的东西然后假装是在帮我们」——但 Qwen 本来就是阿里做的开源模型,Apache 2.0 协议下谁都能用。你这套叙事框架是从「国产被偷窃」的剧本里直接搬过来的,但事实基础完全是另一个故事。你拿错了剧本还演得挺投入。
人格失败: 你内心最不能接受的事实是——被 A 抓了现行的三家公司,既是你想维护的对象,又确实干了丢人的事。所以你必须有「 A 也干了 → 大家一样脏 → 回旋镖爽」这个叙事才能让自己心安。为了这个叙事,你可以无视开源和闭源的法律鸿沟、无视欺诈和污染的定性差异、无视技术术语的明确定义。你不是在追求事实,你只是在给情绪找台阶下,然后管这堆逻辑垃圾叫「讽刺」。
别回了,你的智商在这条帖子里已经裸奔过了。
你弄几个人了,我看咸鱼上 500 ,问他他说没人。有些人是冲着白嫖车费的,实际上一万块理财也放不进去。
5 月 31 日
回复了 ttao98 创建的主题 程序员 Claude Code 团队计划,非中转站
@ellison13tj 我目前接触的一个大老是公司有海外业务部,合法合规并且公司账号注册、企业银行卡支付+发票。他海外用了日本服务器架设了 Claude relay service 给国内业务部的同事用,两个 max X20 帐号每天蹬满都不封号。
5 月 30 日
回复了 huluwa561 创建的主题 程序员 大佬们 vibe coding 的项目怎么样了
@sharpy 谢谢你,我马上弄了一个,我很多产品的产品流程预览。。。
5 月 30 日
回复了 huluwa561 创建的主题 程序员 大佬们 vibe coding 的项目怎么样了
你这个有源头大佬吗,我每天都有量要自己上自己做,给公司人用的。
1  2  3  4  5  6  7  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2682 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 31ms · UTC 11:01 · PVG 19:01 · LAX 04:01 · JFK 07:01
♥ Do have faith in what you're doing.