Anthropic指控国产AI蒸馏Claude，马斯克：你偷来的东西被偷了？

刚刚，Anthropic 扔出了一颗重磅消息称：

DeepSeek、Moonshot AI（月之暗面）和 MiniMax 对 Claude 发起了工业级蒸馏攻击，用超过 24,000 个虚假账号，跟 Claude 进行了超过 1600 万次对话，目的是抽取 Claude 的能力来训练自家模型。

消息一出，科技圈瞬间炸锅了。

但有意思的是，网友们几乎是一边倒地站在了 Anthropic 的对立面，纷纷称这不仅证据不足，而且是贼喊抓贼……

什么是蒸馏攻击

先解释一下「蒸馏」（distillation）。

简单来说，就是用一个强模型的输出来训练一个弱模型。好比让学霸把所有题目的解题思路写一遍，然后拿这些思路去训练另一个学生。

蒸馏本身是个正常的技术手段，AI 公司经常用它来做自家大模型的小型化版本。

但 Anthropic 说的这种不一样。

这三家公司注册了大量虚假账号，大规模、系统性地套取 Claude 的输出，相当于流水线式地抄学霸的作业本，然后拿去给自己的模型「补课」。

三家各有分工

据 Anthropic 发布的报告，三家公司「偷师」的方向各不相同。

DeepSeek 发起了超过 15 万次对话，主要瞄准 Claude 的推理能力。他们让 Claude 一步步展示思考过程，生成「思维链」（chain-of-thought）训练数据，用来开发奖励模型。还有个细节：DeepSeek 还试图从 Claude 那里套取如何回避政治敏感内容审查的替代方案。

Moonshot AI（月之暗面）更激进，340 万次对话，目标是 Claude 的 Agent 能力、工具使用、编程和计算机视觉。它们部署了数百个虚假账号，通过多种渠道访问 Claude，后来还转向了提取和重建推理轨迹。

MiniMax 是三家里量最大的，1300 万次对话，专攻 Agent 编程和工具编排。更夸张的是，Anthropic 发新模型后 24 小时内，MiniMax 就能转向新模型继续抽取。

「九头蛇」式的网络

这些攻击不是注册几个号就完事的了。

Anthropic 把这种攻击架构称为「hydra cluster」（九头蛇集群），一个网络同时管理着 2 万多个虚假账号。它们绑定共享支付方式，用代理服务绕过地区限制，还把蒸馏请求混进正常的 API 调用里。

单看某一条请求，完全无害。但把成千上万条放在一起看，模式就暴露了：大量请求集中瞄准某几个特定能力，prompt 结构高度重复，内容明显是为训练 AI 量身定制的。

Anthropic 说，他们最终靠分类器和行为指纹系统识别出了这些攻击模式。

Anthropic 的安全叙事

Anthropic 在文章中着重渲染了国家安全层面的风险。

他们的逻辑是：非法蒸馏出来的模型会被剥掉安全护栏。原本 Claude 拒绝回答的关于生物武器、恶意网络攻击等内容，蒸馏版本中可能不再有任何限制。这些能力可以被用于军事、情报和大规模监控系统。

Anthropic 呼吁行业、云服务商和政策制定者协同应对这一「威胁」。

网友们不买账

如果只听 Anthropic 一面之词，你可能觉得他们是受害者。

但网友的反应，可以说是相当精彩。

马斯克早前就曾嘲讽到：

「How dare they steal the stuff Anthropic stole from human coders??」（它们怎么敢偷 Anthropic 从人类程序员那里偷来的东西？？）

因为 AI 公司用互联网上的公开数据来训练模型，本身就是一个巨大的争议。

代码、文章、书籍、艺术作品，大量创作者认为自己的作品被无偿拿去用了。

所以当 Anthropic 跳出来说「别人偷了我的模型能力」时，很多人的第一反应是：你们不也是这么过来的吗？

也有网友讽刺道：

「我不敢相信有人会这样偷 Anthropic 的东西。要知道 Anthropic 可是花了数百万工时亲手写代码、写文章、画画、写书来生成训练数据的啊。请尊重知识产权！」

属于高级黑了这是……

还有人直接甩出了 Anthropic 自己的「黑历史」，见Anthropic或将破产：被判「盗版」数百万本书，面临最高7500亿美元天价赔偿：

Anthropic 训练数据里有 700 多万本盗版书，你们自己付过版权费吗？现在跑出来说别人侵犯知识产权？

漫画家 Stonetoss 也是毫不留情：

你们用我的作品训练那个垃圾生成器的时候我没抱怨，所以中国对你们做同样的事，我也不在乎。

有人直接支持被指控的三家公司：

我作为一个美国公民支持你们维持与前沿实验室对等的努力。既然 AI 公司可以偷公众的数据用于商业用途，你们当然也可以偷回来。直接从源头下手，10 分满分。

蒸馏的边界

调侃归调侃，有些人提出了更有深度的问题。

开发者 Will Brown 连发几条追问：

在公开的、宽松许可的 GitHub 仓库上训练模型算不算蒸馏？如果这些仓库里有 Claude 贡献的代码呢？在公开互联网上分享 Claude 的输出违反服务条款吗？AI 公司有义务过滤互联网上的内容吗？

用 Claude Code 写的训练代码去训练竞品模型，算违规吗？构建 RL 环境的 app 模拟器呢？用户模拟器的 prompt 呢？评判模型用的 prompt 呢？合成任务呢？有没有清晰的界定标准？

问题的关键在于：蒸馏的边界到底在哪里？

还有人从商业常识出发质疑：

这在纸面上确实是违反服务条款的，但从大局和公众观感来说，这个立场很弱。

以及有意思的是 X 平台上，该条推文的附加信息：

本文转自：凤凰网科技

原文地址： https://tech.ifeng.com/c/8r0F0obQVcx

Anthropic指控国产AI蒸馏Claude，马斯克：你偷来的东西被偷了？

分类推荐

相关内容

评论一下吧

搜索一下

每日一言

小同爱分享1 个月前

小同爱分享4 个月前

最新文章

阅读TOP榜

标签

链接

搜索

您还没有登录

Anthropic指控国产AI蒸馏Claude，马斯克：你偷来的东西被偷了？

分类推荐

相关内容

评论一下吧

搜索一下

每日一言

小同爱分享1 个月前

小同爱分享4 个月前

最新文章

阅读TOP榜

标签

链接

搜 索

感谢您的打赏

分享文章

搜索