小米大模型永久降价99%，正面对标DeepSeek？

文 | 影子备忘录

此前，DeepSeek宣布API降价，紧接着，小米也宣布其大模型永久降价，最高可达99%。

时间线上看，5月22日，DeepSeek宣布V4-Pro模型API价格永久降价75%，缓存命中输入低至每百万Tokens 0.025元人民币。

仅过了5天，5月27日，小米就祭出杀招：MiMo-V2.5系列API永久降价，最高降幅99%，Pro版缓存命中输入降到与DeepSeek相同的0.025元/百万Tokens，标准版甚至更低——0.02元/百万Tokens。

同一价位、甚至更低，前后脚宣布。这不是跟风，是实实在在的“对标”。

如果你是一名开发者，5月27日这天，你在小米和DeepSeek之间已经不需要再做选择题，因为两边一样便宜。

但如果拉长时间线，我们看到的不只是一场简单的价格战——这是一场关于技术路线、生态战略与AI普惠模式的中国式博弈。

小米与DeepSeek，一个是硬件巨头转型AI的追赶者，一个是纯血AI技术派的破局者。看似都打着“降价”这张牌，但牌桌下面，拼的却是完全不同的底牌。

为什么降价能“永久”？

在拆解双方的技术底牌之前，先问一个更尖锐的问题：凭什么能永久降价？

大模型API的定价，本质上由三部分构成：算力成本+运营成本+合理的利润空间。算力成本是最大的变量，它取决于芯片采购、集群效率和模型本身的推理开销。

DeepSeek敢降价的底气，来自技术底层的颠覆性创新。其V3模型以约600万美元的训练成本实现了对标GPT-4级别的性能——这一数字仅为同类模型训练成本的数十分之一。

DeepSeek自研的稀疏注意力机制使V4系列在处理百万级Token长上下文时，算力消耗仅为上代产品的27%，KV Cache占用降至10%。

它不是用资本换市场，而是用技术换成本。

小米呢？5月26日，雷军宣布未来三年在AI领域投入600亿元。一季度研发投入90亿元，同比增长33.4%，全年研发预计超400亿元。600亿真金白银砸下去，做的是两件事：

一是追赶技术差距，二是摊薄推理成本，靠规模效应和端侧优势把单位成本打下来。

两者的底层逻辑截然不同。

小米真的能打了吗？

在谈论价格之前，先说能力——大模型的核心竞争力，终究是技术本身。

DeepSeek的壁垒是MoE（混合专家）架构的极致工程化。

DeepSeek-V3总参数671B，单Token仅激活约37B参数，激活占比仅约5.5%。加上MLA（多头潜在注意力）机制，KV缓存压缩至传统注意力的几分之一，长文本推理内存大幅降低。

这是从根源上砍算力的能力。

小米追赶的速度超乎很多人预期。MiMo-V2.5系列于2026年4月发布，包含两款核心模型。

MiMo-V2.5-Pro采用MoE架构，总参数1.02T（激活42B），预训练使用27万亿Token，原生序列32K后扩展至1M。

MiMo-V2.5为全模态模型，310B总参数（激活15B），支持文本、图像、视频、音频全模态理解。

在Artificial Analysis综合智能指数和Agent指数上，MiMo-V2.5-Pro均为全球开源模型并列第一。

SWE-bench Pro得分57.2%，超越DeepSeek V4 Pro的55.4%和Gemini 3.1 Pro的54.2%。

Agent任务上，ClawEval得分63.8%，全球开源第一。

在ClawEval测试中，小米表示“每条轨迹仅消耗约7万Token，与GPT-5.4等同等能力水平下相比，Token消耗减少约40%-60%”。

就技术而言，MiMo-V2.5-Pro的推理成本本来就有结构性优势——Token效率做得好，同样的任务消耗更少资源。

降价是能力提升的结果，而非单纯的定价策略调整。

两种技术路线在底层趋同（都走MoE稀疏激活），但能力侧重点不同。

DeepSeek主打通用知识深度与推理能力，MiMo-V2.5-Pro在长上下文Agent任务和多模态领域相对占优。

小米还有一张DeepSeek不具备的王牌：软硬协同的端侧落地。

在小米“人车家全生态”战略下，MiMo大模型正在全面渗透手机、汽车、智能家居。

一季度小米在AI领域研发投入90亿元，小米正在用AI重塑旗下全部终端产品。

AGI研究者罗福莉去年底加盟小米担任MiMo大模型负责人后，团队快速迭代多代模型，完成了从语言到多模态到语音的全矩阵布局。

如果你认为小米只是想卖API赚钱，那就看错了一家硬件巨头的大模型战略。

DeepSeek VS小米，两种降价逻辑的较量

2025年11月，一则人事变动震动AI圈：曾任职DeepSeek的95后AI技术人才罗福莉正式加盟小米，出任MiMo大模型负责人。雷军被传以千万年薪力邀其加入。

在罗福莉的统筹下，小米MiMo大模型快速完成多代迭代，仅用几个月就从MiMo-V2-Pro迭代到V2.5系列，补齐了高性能推理、轻量化通用交互、语音合成等全场景能力。

从DeepSeek到小米，罗福莉带来的不仅是个人能力，更是一种工程师驱动的文化——强调效率、追求低成本高回报的技术路线。

这或许解释了为什么小米的降价逻辑在某种程度上与DeepSeek高度相似：不是补贴战，而是效率战。

此外，据北京商报记者统计，2026年以来小米以密集节奏发布和更新多款模型，从VLA大模型到移动端Agent产品Xiaomi miclaw，从MiMo-V2系列到V2.5系列的全模态模型矩阵，再到语音合成与识别、自动驾驶模型等，覆盖面之广、迭代速度之快，在业界罕见。

这种速度和节奏，在很多企业看来可能是“战略性投入”，但对小米来说，更像是一种“补课”——好在，它补得很快。

回到价格本身，小米此番降价细节值得拆解。

MiMo-V2.5-Pro：输入缓存命中从2.80元降至0.025元/百万Tokens（降99%），输出从42元降至6元（降86%）；MiMo-V2.5标准版：输入缓存命中从1.12元降至0.02元（降98%），输出从28元降至2元（降93%）。

同时，小米取消上下文窗口长度的区分定价，优化Token Plan计费，同等价格下Token用量提升5至8倍。

这场降价大战其实分两个阶段：第一阶段，DeepSeek于4月25日在两天内两次降价，将V4-Pro缓存命中价格降至0.025元，打破了行业价格天花板。

在推理端调用量激增、算力和存储成本高涨的背景下，多数大模型公司选择涨价，部分涨幅甚至高达463%。

DeepSeek逆市降价以技术驱动的成本下降打破行业“AI理应越来越贵”的预期。

第二阶段，小米卡位跟进，价格直接对标DeepSeek，甚至更低。这既是价格战，更是信号战——表明小米在大模型API市场已有规模化的底气和争夺份额的决心。

同样挂着“降价”的招牌，两者逻辑天差地别：

DeepSeek是“技术溢出”：架构创新和工程优化降低了单位推理成本，将部分技术红利直接回馈给市场。它不需要靠降价维持用户，而是降价本身就是技术优势的证明。

小米是“生态卡位”：用硬件利润反哺AI研发，通过降价抢夺开发者用户。

一旦开发者习惯使用MiMo，那开发者在小米IoT生态中开发应用、用AI赋能汽车和手机，都将更加顺畅。API降价不仅是价格战，更是小米构建AI生态的前期投入。

对小米来说，大模型API短期不急于赚钱。小米总裁卢伟冰在财报电话会上明确表示，AI商业化仍处于起步阶段，当前核心战略聚焦于强化基座模型能力，并以自研基座模型赋能“人车家全生态”。

这背后是一条清晰的路径：降价→拉开发者→建生态→反哺硬件→形成闭环。DeepSeek走的是纯技术降本路线，小米走的是生态降本路线。殊途同归，都指向同一个方向：让AI真正便宜下来。

1美元API时代来临了吗？

如果说2025年是中国AI大模型的“百模大战”之年，那么2026年就是“价格战终结之战”。

DeepSeek将缓存命中价格打到0.025元/百万Tokens——调用百万级Token的成本甚至低于通话费。现在小米跟进入场，价格体系基本见底。

小米此番降价背后还有一个值得关注的细节：

2010年代的中国云计算行业，也是经过一轮惨烈的价格战后，加速了企业级客户的上云速度，催生了整个生态的成熟。

如今这一幕正在AI行业重演。

大模型API的极端低价会产生怎样的化学反应？

首先，开发者的门槛被彻底击穿。当一个创业团队只需要几块钱就能跑完模型的整个MVP测试周期，试错成本几乎为零。

AI原生应用的春天可能真的要来了。

其次，大模型的竞争从性能战争升级为“性价比战争”。未来衡量大模型好坏的标准，不只是MMLU、HumanEval这些Benchmark分数，更包括“完成一次实际任务需要花多少钱”。

DeepSeek和小米已经在用行动重新定义竞争规则。

最后，大模型行业加速洗牌。有技术优势的玩家通过降价快速占领市场，缺乏底层技术支撑的厂商要么被迫出局，要么转型走高端定制路线。

行业分析也印证了这一趋势：阿里通义、字节豆包等相继下调API价格，智谱GLM、腾讯混元等主打企业定制服务的则维持稳定甚至小幅上调，形成“通用模型降价走量、高端模型溢价保值”的新格局。

尾声

如果我们只把目光聚焦于小米和DeepSeek的价格厮杀，格局就太小了。

DeepSeek代表着开源AI的崛起。其V4系列不仅价格低，且采用MIT License开源，全球开发者都可自由下载、微调、商用部署。在DeepSeek之前，开源力量从未如此强大。

斯坦福AI指数2026指出，开源模型与闭源模型的性能差距已从17.5个百分点骤降至0.3%。而小米的MiMo-V2.5系列同样采用MIT协议全系开源。

而顶尖模型的开源，正在将AI应用开发的门槛降至历史最低点，行业壁垒从模型本身转向应用场景和数据。

降价不是终点。当API价格趋近于运营成本，大模型公司必须寻找新的价值增长点。

小米已经找到了自己的答案：AI赋能“人车家全生态”。雷军表示小米未来三年600亿AI投入，目标是将AI融入小米的所有核心产品中。

目前小米大模型已登顶OpenRouter平台日榜、周榜双第一，成为全球增长最快的开源智能体首选推理引擎。

对DeepSeek而言，降价本身就是商业逻辑的延续。DeepSeek的开源模型+收费API模式，可能成为中国AI走向全球的另一条路径。

说到这里，我们不禁要问，小米大模型是在对标DeepSeek吗？

答案是肯定的——至少从定价策略上看，小米几乎复刻了DeepSeek的降价打法。但两者之间的“对标”，并不局限于谁能把价格打得更低。

小米对标的是DeepSeek对整个行业发起的挑战：推动API价格逼近成本线，推动模型从闭源走向开源，推动行业竞争从堆算力、拼参数转向比效率、比生态、比落地。

在这场竞赛中，小米找到了一条属于自己的路——不靠纯技术降本一步登天，而是靠生态规模和端侧落地的独特壁垒构筑护城河。

而DeepSeek，则用极致的架构创新证明了——即使是硬件资源受限的中国企业，也能用算法和工程能力做出世界级的模型，并以此撬动整个行业的成本结构。

这场降价对战的终点，不是一个胜利者的加冕，而是AI普惠的起点。

当百万级Token的调用成本低于通话费，当顶尖开源模型向所有开发者免费开放权重，从大公司到初创企业再到个人开发者，AI应用的天花板正被无限推高。

而DeepSeek和小米，恰恰是这场变革中最关键的两大推手。

本文转自：凤凰网科技

原文地址： https://tech.ifeng.com/c/8tTONsLwfeG

小米大模型永久降价99%，正面对标DeepSeek？

分类推荐

相关内容

评论一下吧

搜索一下

每日一言

小同爱分享2 个月前

小同爱分享5 个月前

最新文章

阅读TOP榜

标签

链接

搜索

您还没有登录

小米大模型永久降价99%，正面对标DeepSeek？

分类推荐

相关内容

评论一下吧

搜索一下

每日一言

小同爱分享2 个月前

小同爱分享5 个月前

最新文章

阅读TOP榜

标签

链接

搜 索

感谢您的打赏

分享文章

搜索