
作者|林易
编辑|重点君
近日,红杉资本2026 AI峰会在硅谷低调召开。全球顶尖大厂核心骨干、硅谷风投风向标与顶尖科学家齐聚一堂,深度探讨了AI的最前沿动向。
在过去的两三年里,整个硅谷绝大部分的精力都在干一件事:卷大模型参数,拼跑分基准。但到了2026年,这套逻辑彻底翻篇了。
现如今,AI带来的最大震撼,不再来源于某个新模型的发布,而是底层技术红利正以前所未有的速度,向人们的日常生活与真实工作疯狂溢出。
Andrej Karpathy与各大厂核心负责人在现场达成了一个核心共识:大模型正在越过软件层面,疯狂抢夺物理世界的执行权。
在这场大洗牌中,市场正在发生三大维度的剧变:
1. Coding被基本解决:代码边际成本趋向于零,AI生成代码从辅助补全转向自动化全盘接管。
2. AI开始探索物理规律:AI不再局限于屏幕内的文本与像素,具身智能开始学会物理逻辑,以世界模型为底座的机器人和自动驾驶技术迎来了破局点。
3. 算力已被大厂垄断:大厂可以利用算力规模不断套利,并用未发布的最新模型驱动新一轮创新。
随着市场的改变,旧有的商业模式与组织形态也正在被重构。创业者需要把握服务即软件的新商业模式,在巨头垄断迈向一人独角兽时代。同时,当执行工作被机器以极低成本代劳时,人类真正的核心护城河也更加清晰,不可外包的理解力、顶级的审美品位以及真实的人际连接,将成为AI时代最稀缺、最不可替代的特质。

Coding被基本解决
代码通胀时代:别自己写代码了,去当调度AI的包工头
如今,AI辅助编程已经越过了你写一半它补一半的旧时代,智能体现在能直接接管一整个开发工作流。
在峰会上,Claude Code之父Boris Cherny 表示,他在2026年至今没有亲手写过一行代码。他所负责的代码库中,100%的代码由模型生成。在产能的极值测试中,他曾创下一个人一天内合并150个代码合并请求的纪录。
这种效率的跃升来源于工作方式的彻底颠覆,Cherny详细拆解了他目前的开发流:
他的大部分工作是在手机上完成的,Claude后台常驻着数百个并行运行的Agent,并大量使用循环(Loops)机制,通过设定定时任务(Cron),来调度一个可重复运行的工作。
这些数字劳工不仅能编写功能代码,还在后台自动修复CI的报错、自动处理分支的代码冲突,甚至每30分钟抓取Twitter上的用户反馈进行聚类分析。
Cherny将这种工作模式比作1400年代欧洲印刷术的诞生:过去,软件开发就像中世纪只有少数人掌握的读写特权,而现在,代码生成的边际成本趋近于零。在这个范式下,传统程序员手写代码的核心身份被解构了。未来的工程师不再是砌砖的工人,而是成为了调度数字劳工系统的包工头。
在Anthropic内部,工程经理、产品经理、设计师甚至财务人员,都在通过指挥智能体直接产出代码。而当写代码不再是门槛,跨学科的人才便可以直接越过技术鸿沟,掌控业务层面最高的产品定义权。
中间层正在消失:Software 3.0的降维打击
既然写代码的门槛没了,那么软件本身的形态也要被重新定义。Andrej Karpathy在峰会上提出了Software 3.0理念,指出大模型正在以端到端的方式,吃掉过去20年科技界积累的软件中间层。
Karpathy用一个生动的个人项目“菜单生成器”解释了这种底层架构的坍塌。如果用传统的开发模式,做一个识别外语菜单并生成菜品图片的App,你需要走一套极度冗长的流程:搭建Vercel部署环境、构建前端UI、接入OCR字符识别接口、编写中间层业务逻辑、调用图像生成API、存入数据库、最后返回前端渲染。
但在Software 3.0时代,Karpathy发现,这个App根本就不该存在。他只需要把菜单照片直接扔给最新版的大模型,附带一句指令调用工具,大模型就能直接在原图基础上,把外语翻译好并渲染出实物图。
整个过程里:没有前端、没有后端接口、没有数据库,也没有传统意义上的应用程序。
过去二十年,硅谷建立了一整套围绕API、状态管理和UI框架的庞大生态。这些中间层的存在,仅仅是为了让人类开发者能分工理解复杂信息。但大模型不需要这些人类可读分散信息,它直接消化庞大的上下文并输出最终结果。
这意味着,大量仅仅是在拼凑工作流、缝合API的传统软件公司,他们的技术护城河正面临被大模型端到端直接抹平的降维打击。
不能只依赖Vibe Coding,专业团队需要转向智能体工程
尽管代码生成的下限被无限拉高,Karpathy仍发出警示:在真正的商业运转中,完全靠随意的Vibe Coding是行不通的。专业的开发团队必须转向智能体工程(Agentic Engineering)来保证产品质量和安全的上限。
Karpathy指出,大模型目前最危险的特质是参差不齐的智能。AI能在几分钟内重构十万行的企业级代码,精准找出其中潜伏的安全漏洞。但如果你问它“去50米外的洗车店是该开车还是走路”,它可能会基于字面逻辑一本正经地回答:“距离很近,建议走路去洗车。”
大模型在拥有明确规则的领域(如代码语法、数学计算)像个神通,但在缺乏数据覆盖的日常物理常识上却又像个巨婴。
因此,专业工程师绝对不能完全放权,而是要把智能体当成一个不知疲倦、记忆力超群但偶尔会犯蠢的超级实习生。人类工程师的职责,必须死死把控住三条底线:
系统的总体架构设计绝对不能乱。
产品的终极审美品位必须由人来定。
绝对不可逾越的安全与权限边界必须由人来锁死。
当所有人都能轻易生成代码时,代码本身就不值钱了。真正稀缺的,是能够在一个充满不确定性的AI系统中,能构建出极具稳定性与商业价值软件的系统包工头。

AI开始探索物理规律
VLA模型落幕,世界动作模型(WAMs)成新标配
过去三年,机器人领域的主流路线被视觉-语言-动作模型(VLA,Visual-Language-Action)所统治。
但在峰会上,NVIDIA具身智能负责人Jim Fan尖锐地指出了VLA架构的致命缺陷:VLA本质上是“语言偏科生”,大量参数被倾斜给了语言,导致它们极其擅长理解名词(知识),却对物理世界的动词(物理属性与运动轨迹)一窍不通。
一个典型的尴尬场景是:机器人在听到指令后,能准确识别出目标物,却因为不懂得空间与重力关系,一伸手就把物品碰翻了。
基于这一问题,NVIDIA推出了全新的世界动作模型(World Action Models,WAMs)。
以Dream Zero策略模型为例,执行动作前,Dream Zero会先像做梦一样,在神经网络中推演未来几秒钟的画面,预测未来画面的同时,模型会联合解码出下一步的物理动作。
这就好比机器人在行动前,已经在脑海中完美想象出了杯子被平稳放下的整个物理过程,而身体则根据这个想象同步输出对应的机械指令。Jim Fan总结道:“只要视频预测不翻车,动作就不会翻车。”
正是这种将对未来的视觉预测与物理动作输出深度绑定的机制,让机器人首次展现出在从未见过的陌生环境中,无需预先训练就能直接干活的能力。将物理模拟器内嵌于神经网络的世界动作模型,宣告了VLA时代的落幕,成为具身智能真正的新底座。
跑通具身智能的缩放定律,告别极其笨重的遥操
模型架构的突破只是第一步,机器人商业化最大的门槛是数据饥渴。
语言模型可以通过爬取全互联网的文本完成千亿级参数的训练,但机器人数据的获取成本极其高昂。传统的遥操(人类穿戴设备控制机器人)不仅笨重,而且受限于物理极限。一台机器人一天最多只能收集24小时的数据,还要搭上操作员的精力和硬件的损耗。
为了解决这个问题,NVIDIA的Project Ego Scale开启了一个新的数据工厂模式。Project Ego Scale直接跳过了真实的机器人硬件,利用超过2.1万小时的、人类第一视角在野外场景活动的视频进行大规模预训练。在微调阶段,仅仅混入不到0.1%的高精度机器人遥操作数据,就能让机器人掌握极其复杂的灵巧手操作,例如折叠衬衫和使用注射器。
这一路径的成功,标志着具身智能领域首次跑通了灵巧度的神经缩放定律(Neural Scaling Law for Dexterity)。投入预训练的视频数据越多,机器人的操作损失就呈现越明显的对数线性下降,机器人产业找到了属于自己的数据飞轮。
Jim Fan在峰会上预测:在未来一两年内,传统遥操作的比例将断崖式下跌至几乎可以忽略不计。具身智能的未来,将建立在由海量传感器捕捉的人类真实生活之上。
工程底线决定生死,企业应构建结构化端到端的防线
技术上限决定了机器人能做什么,但工程底线决定了企业能活多久。
在自动驾驶和机器人领域,纯粹的端到端被很多人神化了。面对这种狂热,Waymo联合首席执行官Dmitri Dolgov在峰会上泼了一盆冷水。他认为,如果目标是打造一个部署规模过亿且具备超人类安全性的商业系统,基础的端到端远远不够。因为纯粹的黑盒无法提供极端场景下的可解释性,更无法进行细粒度的安全约束。
Waymo的策略是结构化的端到端(Structured End-to-End),它由三大核心支柱支撑:
司机(Driver):负责理解物理动态与人类社会的行为逻辑,输出行驶策略。
模拟器(Simulator):负责在虚拟空间中构建无穷尽的对抗场景进行压力测试。
评估家(Critic):不可逾越的最后防线,负责对司机的每一个潜在动作进行严苛的安全评估。
Waymo目前每周的纯无人驾驶里程已突破400万英里,严重工伤事故率降至人类驾驶员的十三分之一。Dolgov向整个AI行业强调:在关乎生命和高价值资产的场景中,永远不要将系统控制权完全交给一个不可解释的黑盒。

算力已被大厂垄断
算力成了大厂的印钞机
在谈及OpenAI如今的核心商业模式时,OpenAI联合创始人兼总裁Greg Brockman给出了一个直白的答案:
“在很大程度上,我们有一个非常简单的业务:我们购买、租赁、建造算力,然后以一定的利润率转售它。就是这样。”
只要这个利润率为正,OpenAI就会无限期地扩大规模,因为人类对解决问题的需求是无限的。
然而,现在的供应链无法满足这样无限的需求。Brockman在峰会上透露,到了2026年,全球GPU算力的有效闲置获取率“四舍五入等于零”。这不仅是因为参数规模的扩张,更是因为现代模型在推理端消耗的算力正在呈指数级暴涨。
对于基础大模型厂商而言,算力就是维持其竞争力的坚固护城河。根据规模定律(Scaling Law),大厂不需要精妙的模型架构创新,仅靠算力暴力扩张,就能让神经网络算法展现出性能飙升。
红杉指出,自从具备复杂推理能力的模型(如OpenAI的o1及后续迭代)面世后,模型在回答问题时思考得越久、消耗的推理算力越多,输出的答案就越精准、越具突破性。当这种暴力计算被运用到科研领域,AI甚至已经推导出了让顶尖物理学家都惊叹的全新理论公式。
另一方面,AI巨头们还拥有最前沿的创新生态。Brockman坦言,OpenAI内部的团队之所以能保持极高的创新效率,是因为他们使用的是比外界能接触到的版本领先一到两代的未发布模型。
这种巨大的技术时间差,让基础模型厂商建立起了绝对的生态碾压优势。当创业者还在为一个模型缺陷苦苦开发外围的补丁时,大厂可能已经大版本更新中,从底层直接修复了这个问题,顺手抹平了创业者辛苦建立的功能壁垒。

给创业者的破局指南
在算力被巨头垄断,模型大厂以月为单位迭代模型能力的情况下,创业者该如何突围?对此,红杉给出了三点建议:
1. 用MAD法则构建逆向护城河
红杉合伙人Pat Grady为全场创业者划定了一条生存红线:不要试图去补齐大模型现存的能力短板,因为下一代模型会用更暴力的算力将其直接覆盖。
他给出了一套名为MAD的方案:
M(Moats;护城河):放弃在底层技术上建立护城河的幻想,深挖垂直行业。真正的护城河是逆向从业务出发的。创业者需要深入客户最繁杂的业务细节、合规流程和数据孤岛。这些业务内容的演进速度极慢,是大厂的通用API无法轻易覆盖。
A(Affordance;直觉化供给):尽管目前的终端控制台和API极其强大,但对企业的普通业务员来说,这些界面存在认知门槛。创业者的核心任务在于,将复杂的智能体任务流,封装成无需解释、一看就懂的傻瓜式操作界面。用户不需要理解后台有多少个Agent在协作,他们只需要看到一个能跑完完整流程且结果可归因的交付成果。
D(Diffusion;扩散红利):创业者要学会在技术落差中套利。基础模型变强的速度,远快于传统企业吸收这些能力的速度。这个巨大的扩散缺口就是初创公司的巨大套利空间。
2. 探索服务即软件的新商业模式
如果说上一代云计算浪潮的成功之处,是将全球软件市场的盘子做到了6500亿美元,那么如今的AI浪潮正在塑造一个规模高达十万亿美元的专业服务市场。
Pat Grady在峰会上算了一笔惊人的账:单单是美国本土的法律服务市场,规模就高达4000亿美元,这一个垂直赛道的体量就已经与全球软件市场的总和相当。基于这一巨大的想象空间,红杉合伙人Sonya Huang指出了AI时代的新商业模式:服务即软件(Services is the new software)。
过去的SaaS(软件即服务)卖的是提升人类工作效率的工具,而未来的AI卖的是直接交付的最终结果。
Sonya Huang描绘了一幅智能体全面接管各类专业服务的图景:
在医疗领域,用户可以直接雇用医疗Agent来分析个人的基因组、提供个性化医疗建议、开具处方,甚至精准匹配和推荐临床试验。
在法律界,Agent可以直接代表客户去进行合同条款的谈判、处理法律诉讼,甚至达成最终和解。
在基础科学领域,Agent不仅能解决极其复杂的数学难题,甚至已经开始自主发现全新的超导体材料。
在个人消费端,超级私人助理将无缝接管用户的收件箱、日程表、个人财务管理,乃至全自动完成报税。
而经济学规律将推动这一模式颠覆传统行业。Sonya Huang指出,人类员工极难规模化扩张,并且成本极其昂贵。“你付给人类的是高昂的薪水,而付给Agent的仅仅是代币(Tokens)。”
许多情况下,用Tokens完成一项专业任务的成本,已经远远低于同等工作量下的人类薪水成本。随着智能体在越来越多领域的智力表现即将超越人类,那些能够率先将传统重人力、高壁垒的专业服务,打包成Agent接口的初创公司,将迎来指数级的财富爆发。
3. 创业者迎来一人独角兽时代
随着AI接管了代码与执行层,构建产品的边际成本已近乎为零,过去需要整个团队开发数周的功能,现在普通员工通过智能体几个小时就能搞定。在这种情况下,初创企业的敏捷的组织形态反而更能帮助他们赢得市场胜利。
Boris Cherny认为,大公司虽然拥有资源,但它们背负着极其沉重的历史包袱。巨头们如果想拥抱新范式,需要耗费数年重构复杂的业务流程,重新培训成千上万的员工,还要解决内部巨大的组织惯性和利益部门的抵触情绪。相反,微型初创团队从成立的第一天起,就能以AI原生的姿态上阵,没有沟通损耗,没有技术债务,甚至可以直接向传统巨头发起同等量级的商业竞争。
而跨学科通才将享受到最大的时代红利。如Anthropic内部所展现的那样,公司内部没有纯粹的部门壁垒,所有人都可以自己用AI写代码,解决工作需求。对于初创企业来说,未来最优秀的财务软件开发者不再是懂代码的程序员,而是深刻理解商业逻辑的顶尖财务人员。创业者在招募团队时,应彻底抛弃螺丝钉思维,寻找那些具备能直接跨界调度AI产出结果的人才。
在峰会上Greg Brockman指出,未来每个人都可以成为统帅十万Agent大军的超级CEO,只需调度云端不知疲倦、按Token计费的数字员工,就能支撑起一家估值上亿的独角兽实体。在未来的竞争中,你的组织能多大程度地接纳和指挥数字智能体,就是你拥有多少产品定价权的新起点。

AI时代人类的核心护城河
当技术在底层飞速迭代,最终转化为商业模式的洗牌时,整场峰会也同步在讨论一个终极命题:
在一个99.9%的认知与执行都被机器代劳的世界里,人类的核心护城河究竟将退守何处?
面对技术盲盒的终结,很多从业者恐慌自己将失去执行价值。但红杉认为,剥离掉机械劳作后,人类真正的核心护城河才刚刚显露:
第一,无法外包的理解力。
“你可以外包你的思考,但你绝不能外包你的理解。”Andrej Karpathy强调,尽管大模型在处理信息、生成代码上非常强大,但人类依然是整个系统的理解中枢。机器不知道为什么要做这件事,只有人类才能把握构建产品的初衷,并为AI指引方向。当把事情做完变得无比廉价时,判断“这是不是一件好事情”“这是否符合我们的价值观”,就成了决定成败的关键。
第二,顶级的审美品位。
当所有人都能用AI一秒生成结构完整的软件时,功能齐全已经沦为廉价的标配,平庸将成为最大的败笔。未来的品牌溢价和商业价值,属于那些知道什么是卓越、什么是极致体验的人。AI时代,品味就是最高级别的生产力。
第三,不可替代的人际连接。
当一切服务都可以由Agent以极低成本提供时,人类将更渴求同类参与感。红杉合伙人Constantine指出,在真空的环境下,任何事物本身都是没有价值的,无论是曾经比黄金还珍贵的铝,还是如今算力庞大的超级智能,它们只有映射在人类的真实体验中,才拥有意义。机器可以一秒钟出具一份的法律判决,但它永远无法交付同理心、信任感,以及拥有共同承担责任的能力。
今年的红杉AI峰会,没有兜售廉价的乌托邦幻梦,也没有贩卖末日论恐慌,它向全行业释放了一个清晰的商业信号:当算力被巨头垄断、生成代码的边际成本趋于零时,纯技术已不再是牢不可破的护城河。未来的商业竞争,正在向直接交付商业结果转移。在十万亿级的服务市场中,用跨界思维重塑交付体验的商业机会,刚刚向每一位创业者敞开。
本文转自:凤凰网科技
原文地址: https://tech.ifeng.com/c/8svnQ4nNtyZ

小同爱分享2 个月前
疫情,就是让人抑郁,又没了感情。 - 小同爱分享
小同爱分享3 个月前
所谓生活不如意,就是缺少人民币。 - 小同爱分享