刚刚,Anthropic 扔出了一颗重磅消息称:
DeepSeek、Moonshot AI(月之暗面)和 MiniMax 对 Claude 发起了工业级蒸馏攻击,用超过 24,000 个虚假账号,跟 Claude 进行了超过 1600 万次对话,目的是抽取 Claude 的能力来训练自家模型。

消息一出,科技圈瞬间炸锅了。
但有意思的是,网友们几乎是一边倒地站在了 Anthropic 的对立面,纷纷称这不仅证据不足,而且是贼喊抓贼……
什么是蒸馏攻击
先解释一下「蒸馏」(distillation)。
简单来说,就是用一个强模型的输出来训练一个弱模型。好比让学霸把所有题目的解题思路写一遍,然后拿这些思路去训练另一个学生。
蒸馏本身是个正常的技术手段,AI 公司经常用它来做自家大模型的小型化版本。
但 Anthropic 说的这种不一样。

这三家公司注册了大量虚假账号,大规模、系统性地套取 Claude 的输出,相当于流水线式地抄学霸的作业本,然后拿去给自己的模型「补课」。

三家各有分工
据 Anthropic 发布的报告,三家公司「偷师」的方向各不相同。
DeepSeek 发起了超过 15 万次对话,主要瞄准 Claude 的推理能力。他们让 Claude 一步步展示思考过程,生成「思维链」(chain-of-thought)训练数据,用来开发奖励模型。还有个细节:DeepSeek 还试图从 Claude 那里套取如何回避政治敏感内容审查的替代方案。
Moonshot AI(月之暗面)更激进,340 万次对话,目标是 Claude 的 Agent 能力、工具使用、编程和计算机视觉。它们部署了数百个虚假账号,通过多种渠道访问 Claude,后来还转向了提取和重建推理轨迹。
MiniMax 是三家里量最大的,1300 万次对话,专攻 Agent 编程和工具编排。更夸张的是,Anthropic 发新模型后 24 小时内,MiniMax 就能转向新模型继续抽取。
「九头蛇」式的网络
这些攻击不是注册几个号就完事的了。
Anthropic 把这种攻击架构称为「hydra cluster」(九头蛇集群),一个网络同时管理着 2 万多个虚假账号。它们绑定共享支付方式,用代理服务绕过地区限制,还把蒸馏请求混进正常的 API 调用里。
单看某一条请求,完全无害。但把成千上万条放在一起看,模式就暴露了:大量请求集中瞄准某几个特定能力,prompt 结构高度重复,内容明显是为训练 AI 量身定制的。
Anthropic 说,他们最终靠分类器和行为指纹系统识别出了这些攻击模式。
Anthropic 的安全叙事
Anthropic 在文章中着重渲染了国家安全层面的风险。
他们的逻辑是:非法蒸馏出来的模型会被剥掉安全护栏。原本 Claude 拒绝回答的关于生物武器、恶意网络攻击等内容,蒸馏版本中可能不再有任何限制。这些能力可以被用于军事、情报和大规模监控系统。
Anthropic 呼吁行业、云服务商和政策制定者协同应对这一「威胁」。
网友们不买账
如果只听 Anthropic 一面之词,你可能觉得他们是受害者。
但网友的反应,可以说是相当精彩。
马斯克早前就曾嘲讽到:

「How dare they steal the stuff Anthropic stole from human coders??」(它们怎么敢偷 Anthropic 从人类程序员那里偷来的东西??)
因为 AI 公司用互联网上的公开数据来训练模型,本身就是一个巨大的争议。

代码、文章、书籍、艺术作品,大量创作者认为自己的作品被无偿拿去用了。
所以当 Anthropic 跳出来说「别人偷了我的模型能力」时,很多人的第一反应是:你们不也是这么过来的吗?
也有网友讽刺道:
「我不敢相信有人会这样偷 Anthropic 的东西。要知道 Anthropic 可是花了数百万工时亲手写代码、写文章、画画、写书来生成训练数据的啊。请尊重知识产权!」
属于高级黑了这是……

还有人直接甩出了 Anthropic 自己的「黑历史」,见Anthropic或将破产:被判「盗版」数百万本书,面临最高7500亿美元天价赔偿:
Anthropic 训练数据里有 700 多万本盗版书,你们自己付过版权费吗?现在跑出来说别人侵犯知识产权?

漫画家 Stonetoss 也是毫不留情:
你们用我的作品训练那个垃圾生成器的时候我没抱怨,所以中国对你们做同样的事,我也不在乎。

有人直接支持被指控的三家公司:
我作为一个美国公民支持你们维持与前沿实验室对等的努力。既然 AI 公司可以偷公众的数据用于商业用途,你们当然也可以偷回来。直接从源头下手,10 分满分。

蒸馏的边界
调侃归调侃,有些人提出了更有深度的问题。
开发者 Will Brown 连发几条追问:
在公开的、宽松许可的 GitHub 仓库上训练模型算不算蒸馏?如果这些仓库里有 Claude 贡献的代码呢?在公开互联网上分享 Claude 的输出违反服务条款吗?AI 公司有义务过滤互联网上的内容吗?
用 Claude Code 写的训练代码去训练竞品模型,算违规吗?构建 RL 环境的 app 模拟器呢?用户模拟器的 prompt 呢?评判模型用的 prompt 呢?合成任务呢?有没有清晰的界定标准?
问题的关键在于:蒸馏的边界到底在哪里?
还有人从商业常识出发质疑:
这在纸面上确实是违反服务条款的,但从大局和公众观感来说,这个立场很弱。
以及有意思的是 X 平台上,该条推文的附加信息:

本文转自:凤凰网科技
原文地址: https://tech.ifeng.com/c/8r0F0obQVcx

小同爱分享17 天前
疫情,就是让人抑郁,又没了感情。 - 小同爱分享
小同爱分享25 天前
所谓生活不如意,就是缺少人民币。 - 小同爱分享