文 | 影子备忘录

此前,DeepSeek宣布API降价,紧接着,小米也宣布其大模型永久降价,最高可达99%。

时间线上看,5月22日,DeepSeek宣布V4-Pro模型API价格永久降价75%,缓存命中输入低至每百万Tokens 0.025元人民币。

仅过了5天,5月27日,小米就祭出杀招:MiMo-V2.5系列API永久降价,最高降幅99%,Pro版缓存命中输入降到与DeepSeek相同的0.025元/百万Tokens,标准版甚至更低——0.02元/百万Tokens。

同一价位、甚至更低,前后脚宣布。这不是跟风,是实实在在的“对标”。

如果你是一名开发者,5月27日这天,你在小米和DeepSeek之间已经不需要再做选择题,因为两边一样便宜。

但如果拉长时间线,我们看到的不只是一场简单的价格战——这是一场关于技术路线、生态战略与AI普惠模式的中国式博弈。

小米与DeepSeek,一个是硬件巨头转型AI的追赶者,一个是纯血AI技术派的破局者。看似都打着“降价”这张牌,但牌桌下面,拼的却是完全不同的底牌。

为什么降价能“永久”?

在拆解双方的技术底牌之前,先问一个更尖锐的问题:凭什么能永久降价?

大模型API的定价,本质上由三部分构成:算力成本+运营成本+合理的利润空间。算力成本是最大的变量,它取决于芯片采购、集群效率和模型本身的推理开销。

DeepSeek敢降价的底气,来自技术底层的颠覆性创新。其V3模型以约600万美元的训练成本实现了对标GPT-4级别的性能——这一数字仅为同类模型训练成本的数十分之一。

DeepSeek自研的稀疏注意力机制使V4系列在处理百万级Token长上下文时,算力消耗仅为上代产品的27%,KV Cache占用降至10%。

它不是用资本换市场,而是用技术换成本。

小米呢?5月26日,雷军宣布未来三年在AI领域投入600亿元。一季度研发投入90亿元,同比增长33.4%,全年研发预计超400亿元。600亿真金白银砸下去,做的是两件事:

一是追赶技术差距,二是摊薄推理成本,靠规模效应和端侧优势把单位成本打下来。

两者的底层逻辑截然不同。

小米真的能打了吗?

在谈论价格之前,先说能力——大模型的核心竞争力,终究是技术本身。

DeepSeek的壁垒是MoE(混合专家)架构的极致工程化。

DeepSeek-V3总参数671B,单Token仅激活约37B参数,激活占比仅约5.5%。加上MLA(多头潜在注意力)机制,KV缓存压缩至传统注意力的几分之一,长文本推理内存大幅降低。

这是从根源上砍算力的能力。

小米追赶的速度超乎很多人预期。MiMo-V2.5系列于2026年4月发布,包含两款核心模型。

MiMo-V2.5-Pro采用MoE架构,总参数1.02T(激活42B),预训练使用27万亿Token,原生序列32K后扩展至1M。

MiMo-V2.5为全模态模型,310B总参数(激活15B),支持文本、图像、视频、音频全模态理解。

在Artificial Analysis综合智能指数和Agent指数上,MiMo-V2.5-Pro均为全球开源模型并列第一。

SWE-bench Pro得分57.2%,超越DeepSeek V4 Pro的55.4%和Gemini 3.1 Pro的54.2%。

Agent任务上,ClawEval得分63.8%,全球开源第一。

在ClawEval测试中,小米表示“每条轨迹仅消耗约7万Token,与GPT-5.4等同等能力水平下相比,Token消耗减少约40%-60%”。

就技术而言,MiMo-V2.5-Pro的推理成本本来就有结构性优势——Token效率做得好,同样的任务消耗更少资源。

降价是能力提升的结果,而非单纯的定价策略调整。

两种技术路线在底层趋同(都走MoE稀疏激活),但能力侧重点不同。

DeepSeek主打通用知识深度与推理能力,MiMo-V2.5-Pro在长上下文Agent任务和多模态领域相对占优。

小米还有一张DeepSeek不具备的王牌:软硬协同的端侧落地。

在小米“人车家全生态”战略下,MiMo大模型正在全面渗透手机、汽车、智能家居。

一季度小米在AI领域研发投入90亿元,小米正在用AI重塑旗下全部终端产品。

AGI研究者罗福莉去年底加盟小米担任MiMo大模型负责人后,团队快速迭代多代模型,完成了从语言到多模态到语音的全矩阵布局。

如果你认为小米只是想卖API赚钱,那就看错了一家硬件巨头的大模型战略。

DeepSeek VS小米,两种降价逻辑的较量

2025年11月,一则人事变动震动AI圈:曾任职DeepSeek的95后AI技术人才罗福莉正式加盟小米,出任MiMo大模型负责人。雷军被传以千万年薪力邀其加入。

在罗福莉的统筹下,小米MiMo大模型快速完成多代迭代,仅用几个月就从MiMo-V2-Pro迭代到V2.5系列,补齐了高性能推理、轻量化通用交互、语音合成等全场景能力。

从DeepSeek到小米,罗福莉带来的不仅是个人能力,更是一种工程师驱动的文化——强调效率、追求低成本高回报的技术路线。

这或许解释了为什么小米的降价逻辑在某种程度上与DeepSeek高度相似:不是补贴战,而是效率战。

此外,据北京商报记者统计,2026年以来小米以密集节奏发布和更新多款模型,从VLA大模型到移动端Agent产品Xiaomi miclaw,从MiMo-V2系列到V2.5系列的全模态模型矩阵,再到语音合成与识别、自动驾驶模型等,覆盖面之广、迭代速度之快,在业界罕见。

这种速度和节奏,在很多企业看来可能是“战略性投入”,但对小米来说,更像是一种“补课”——好在,它补得很快。

回到价格本身,小米此番降价细节值得拆解。

MiMo-V2.5-Pro:输入缓存命中从2.80元降至0.025元/百万Tokens(降99%),输出从42元降至6元(降86%);MiMo-V2.5标准版:输入缓存命中从1.12元降至0.02元(降98%),输出从28元降至2元(降93%)。

同时,小米取消上下文窗口长度的区分定价,优化Token Plan计费,同等价格下Token用量提升5至8倍。

这场降价大战其实分两个阶段:第一阶段,DeepSeek于4月25日在两天内两次降价,将V4-Pro缓存命中价格降至0.025元,打破了行业价格天花板。

在推理端调用量激增、算力和存储成本高涨的背景下,多数大模型公司选择涨价,部分涨幅甚至高达463%。

DeepSeek逆市降价以技术驱动的成本下降打破行业“AI理应越来越贵”的预期。

第二阶段,小米卡位跟进,价格直接对标DeepSeek,甚至更低。这既是价格战,更是信号战——表明小米在大模型API市场已有规模化的底气和争夺份额的决心。

同样挂着“降价”的招牌,两者逻辑天差地别:

DeepSeek是“技术溢出”:架构创新和工程优化降低了单位推理成本,将部分技术红利直接回馈给市场。它不需要靠降价维持用户,而是降价本身就是技术优势的证明。

小米是“生态卡位”:用硬件利润反哺AI研发,通过降价抢夺开发者用户。

一旦开发者习惯使用MiMo,那开发者在小米IoT生态中开发应用、用AI赋能汽车和手机,都将更加顺畅。API降价不仅是价格战,更是小米构建AI生态的前期投入。

对小米来说,大模型API短期不急于赚钱。小米总裁卢伟冰在财报电话会上明确表示,AI商业化仍处于起步阶段,当前核心战略聚焦于强化基座模型能力,并以自研基座模型赋能“人车家全生态”。

这背后是一条清晰的路径:降价→拉开发者→建生态→反哺硬件→形成闭环。DeepSeek走的是纯技术降本路线,小米走的是生态降本路线。殊途同归,都指向同一个方向:让AI真正便宜下来。

1美元API时代来临了吗?

如果说2025年是中国AI大模型的“百模大战”之年,那么2026年就是“价格战终结之战”。

DeepSeek将缓存命中价格打到0.025元/百万Tokens——调用百万级Token的成本甚至低于通话费。现在小米跟进入场,价格体系基本见底。

小米此番降价背后还有一个值得关注的细节:

2010年代的中国云计算行业,也是经过一轮惨烈的价格战后,加速了企业级客户的上云速度,催生了整个生态的成熟。

如今这一幕正在AI行业重演。

大模型API的极端低价会产生怎样的化学反应?

首先,开发者的门槛被彻底击穿。当一个创业团队只需要几块钱就能跑完模型的整个MVP测试周期,试错成本几乎为零。

AI原生应用的春天可能真的要来了。

其次,大模型的竞争从性能战争升级为“性价比战争”。未来衡量大模型好坏的标准,不只是MMLU、HumanEval这些Benchmark分数,更包括“完成一次实际任务需要花多少钱”。

DeepSeek和小米已经在用行动重新定义竞争规则。

最后,大模型行业加速洗牌。有技术优势的玩家通过降价快速占领市场,缺乏底层技术支撑的厂商要么被迫出局,要么转型走高端定制路线。

行业分析也印证了这一趋势:阿里通义、字节豆包等相继下调API价格,智谱GLM、腾讯混元等主打企业定制服务的则维持稳定甚至小幅上调,形成“通用模型降价走量、高端模型溢价保值”的新格局。

尾声

如果我们只把目光聚焦于小米和DeepSeek的价格厮杀,格局就太小了。

DeepSeek代表着开源AI的崛起。其V4系列不仅价格低,且采用MIT License开源,全球开发者都可自由下载、微调、商用部署。在DeepSeek之前,开源力量从未如此强大。

斯坦福AI指数2026指出,开源模型与闭源模型的性能差距已从17.5个百分点骤降至0.3%。而小米的MiMo-V2.5系列同样采用MIT协议全系开源。

而顶尖模型的开源,正在将AI应用开发的门槛降至历史最低点,行业壁垒从模型本身转向应用场景和数据。

降价不是终点。当API价格趋近于运营成本,大模型公司必须寻找新的价值增长点。

小米已经找到了自己的答案:AI赋能“人车家全生态”。雷军表示小米未来三年600亿AI投入,目标是将AI融入小米的所有核心产品中。

目前小米大模型已登顶OpenRouter平台日榜、周榜双第一,成为全球增长最快的开源智能体首选推理引擎。

对DeepSeek而言,降价本身就是商业逻辑的延续。DeepSeek的开源模型+收费API模式,可能成为中国AI走向全球的另一条路径。

说到这里,我们不禁要问,小米大模型是在对标DeepSeek吗?

答案是肯定的——至少从定价策略上看,小米几乎复刻了DeepSeek的降价打法。但两者之间的“对标”,并不局限于谁能把价格打得更低。

小米对标的是DeepSeek对整个行业发起的挑战:推动API价格逼近成本线,推动模型从闭源走向开源,推动行业竞争从堆算力、拼参数转向比效率、比生态、比落地。

在这场竞赛中,小米找到了一条属于自己的路——不靠纯技术降本一步登天,而是靠生态规模和端侧落地的独特壁垒构筑护城河。

而DeepSeek,则用极致的架构创新证明了——即使是硬件资源受限的中国企业,也能用算法和工程能力做出世界级的模型,并以此撬动整个行业的成本结构。

这场降价对战的终点,不是一个胜利者的加冕,而是AI普惠的起点。

当百万级Token的调用成本低于通话费,当顶尖开源模型向所有开发者免费开放权重,从大公司到初创企业再到个人开发者,AI应用的天花板正被无限推高。

而DeepSeek和小米,恰恰是这场变革中最关键的两大推手。

本文转自:凤凰网科技

原文地址: https://tech.ifeng.com/c/8tTONsLwfeG