
摘要:
“量产,归根到底是产生一大堆铁疙瘩。铁疙瘩本身是没有意义的,它必须要有那颗核心,就是它的智能,”
凤凰网科技《浪潮》出品
作者|赵子坤
编辑|董雨晴
2026年开年,具身智能赛道的竞争悄然转向。
过去两年,主流叙事是“先工厂后家庭”。但从今年春天开始,风向变了。自变量宣布入驻家庭,欧拉万象押注家庭场景,家电巨头们相继亮出家庭服务机器人布局。家庭,正在从“远期愿景”变成一条清晰的新战线。
在这条战线上,许华哲是较早亮明旗帜的那个人。
2026年2月,星海图刚完成10亿元B轮融资、跻身百亿独角兽俱乐部,身为联合创始人兼首席科学家的许华哲却选择“自立门户”,创立新公司破壳机器人,聚焦C端家庭场景。
凤凰网科技了解到,破壳机器人近期完成数千万美元天使轮融资,由云启资本领投,同时也获得多家美元基金、头部互联网战投、一线人民币基金与知名产投方等支持。
在具身智能圈,许华哲与吴翼、高阳、陈建宇并称“伯克利归国四子”——四位从清华到伯克利、再回清华任教、最终投身创业或深耕研究的青年学者。而今,随着许华哲另立“破壳”,四子正式各立山头。
与同行们热衷拼产能、比出货的节奏不同,许华哲选择了一条更漫长的路:不做工厂里“拧螺丝”的专机,直接让机器人进家。在他看来,家庭是最需要通用性、数据最丰富的地方,最可能孕育出强大的通用智能体。
就在一个月前,凤凰网科技在其刚搭建好的办公室,与许华哲进行了一场深度对话。
他不关心出货量,只追问一个尚无答案的问题:“卖出去的机器人,每天的日活是多少?”他提醒行业,“量产的只是铁疙瘩,智能才是那颗核心”。谈及中美路线差异,他的焦虑同样直白:“绝对不能我们造身体,等美国造大脑。”
通往物理AGI的路还很长。这位渴望“打响第一枪”的创业者,正试图用他的方式,争夺定义未来的话语权。
以下是对话实录,在不改变原意的情况下经编辑发布。

“一定要足够通用,机器人才能进家”
凤凰网科技:2月,星海图刚完成了10亿的B轮融资,成为继宇树、智元之后又一家百亿具身独角兽。势头正好,你为什么选择在这个时间点离职?
许华哲:创业本质是构建未来的想象,星海图发展当然很好,但是在它自己想象的那个未来以及路径上的。我想的那个未来,技术、组织文化上,跟他们都不太一样,所以还是决定自己来做这件事。我想做的那件事,只有我自己可以做,在星海图内部可能没有办法。
凤凰网科技:你想做的是什么?
许华哲:我想做一个家庭机器人,像管家一样到千家万户。不仅能帮你把家务活干了,同时还足够懂你,它知道你是一个喜欢晨跑的人,所以早上会给你准备好运动的衣服;也知道晚上你习惯喝一杯牛奶再入睡,你伸手的时候,它就把那杯热牛奶递给你了。
希望是一个有主动性的、可以干活的机器人进家,这是我粗糙想象的一个未来。有了这个远景后,希望用自己的技术,基于强化学习,基于Scaling Law,去做模型的训练、本体的建设,最终让家庭机器人走进千家万户。
凤凰网科技:从去年8月内部有分歧到今年2月离职,这半年你做了哪些准备?
许华哲:我们其实跑了很多地方,去实地看工厂,到底哪里可以用机器人,哪里不能用。去了汽车工厂、物流工厂、食品工厂、传统轻工业制造、酒店行业,跑了蛮多地方。
得出的结论是,让机器人去做重复性工作,一定程度上未必需要人形,也许一个机械臂就可以干的事,本质是希望把那件小事重复、高效、准确地完成。
我创业也不是一脑子热就去创的。是看到很多火苗,展示出通用具身智能的能力,无论是Generalist的27万小时数据,还是PI放出来的一些成果,看到了很多通用性的潜力。
也做了某种意义上的用户调研。我给我当时在美国的朋友打电话,说我要是给你做一个能帮你备菜的机器人,这事儿怎么样?他说太好了。我问那你觉得要付多少钱?他说200美元,因为他会对标热水壶或者高压锅。
当机器人一旦是专机的时候,大家的付费意愿会找到它在家里面的最近邻。如果你是叠衣服,他会找烘干机、洗衣机;如果你是备菜,他会找热水壶和高压锅;如果你是清洁,他会找扫地机。
所以我们的最后一个结论是:一定要通用,就是它是一个让大家很舒服、干各种各样事、足够通用性的东西,大家才可能愿意欢迎这样一个新朋友到自己家里。
凤凰网科技:而且这个价格一定要降到足够低,大家才能接受。
许华哲:这我倒不这么认为。如果它是专机,大家通常给的价格是非常低的,是它对应的最近邻的机器的价格。但如果它是一个通用的机器,既能叠衣服,又能备菜,又能帮你清洁,又能把家里的猫毛清理掉,等等等等,这个时候大家对溢价的接受度是非常高的。因为本质上就来到了管家这样的一个定义。一定程度上,通用是机器人走进家庭的一个先决条件。
凤凰网科技:很多具身企业为了商业化第一步通常是进工厂,而你是想直接绕过这一步做面向家庭的机器人?
许华哲:是,这个先和后我有一些不同的看法。大模型是很好的例子,是先有了通用性,再分化出来可以干各种各样事。但归根结底,最主要是它有一个通用的好的AI模型。一定程度上,机器人也会是这样的发展路线。
它在工厂里面落地,每做一个项目也就是完成了个项目,对达到最终的物理通用智能(Physical AGI),没有太多帮助。
所以我会倾向于先让机器人足够通用,再到各个不同的板块去做应用。家是最需要通用性的地方,也是数据最丰富的地方,最可能孕育出一个强大的通用智能体的地方。
凤凰网科技:你脑海中那个画面最终实现大概还有多久?
许华哲:还有点远,可能5-10年。我们希望两年有一点点进展,机器人能真正到家里面开始做一些事情。5-10年后,也许就是坐在这个办公室里,机器人在办公室里面已经在帮我们干很多事了,往外望去,也会发现很多机器人在路上跑来跑去,拎着它的外卖袋子,或者是夹着它的公文包,或是拿着篮球在去做教练的路上。
凤凰网科技:所以你认为两年之内,初步机器人进家是有可能实现的?
许华哲:是有可能实现的。

“量产本身只是铁疙瘩,拼产能不该是目标”
凤凰网科技:从联合创始人到自己创业,这种转变对你有哪些新的挑战?
许华哲:有很多新的事情要处理,新的方向要去思考。最主要的是在战略上,要想技术上怎么选择、商业上什么节奏、人才上什么画像和密度,包括怎么用钱。这些作为联合创始人时也会想,但不会想所有的部分。
另一件事是构建文化。对于任何一个组织,无论它是学校的Lab还是公司,它的文化和气场、组织的形态往往是由创始人决定的。
怎么样让大家有活力的、有机的——这个有机是指每个人都很有主观能动性,在这干得很起劲,一起为了梦想去努力,也是我现在很努力在想的。
凤凰网科技:高继扬提到你的离职时,说赞同你的选择,觉得非常理想主义。但他认为现阶段面向C端做机器人,对资源有限的初创公司来说投入产出比不高,是一条非常艰难的路。你认可吗?
许华哲:首先这就是路径判断上的不同。我认为通用性需要好的数据,好的数据来自于复杂的场景,复杂的场景如果去排,家里面和类家的——比如养老院、酒店——这一类的场景是通用性相对好的。
做这件事情投入产出比是一方面,但马斯克说的有道理:有时候必须要做这件事,即使概率没有站在你这边,因为这是正确的事情。很多时候,最伟大的事情不能用ROI来计算。
OpenAI在GPT出来之前,是一个重金投入但毫无产出的家伙,如果你那样去计算,它的短期投入产出比是非常非常低的,但只有这样长期才有可能有一个巨大的、对整个人类的回报。我会更看在公司、在人类、在我自己的人生的尺度上面,这个ROI是怎么算的。
凤凰网科技:Future Robot三年累计投入过亿,做全栈自研。这个融资节奏是否证明面向C端的机器人公司在钱上的需求更大?
许华哲:在钱上的需求这件事不好说,取决于是否在AI上面有足够大的目标和雄心。如果在AI上面有足够大的目标,是非常需要资金投入的。
凤凰网科技:春节之后赛道又非常热,多家具身公司融了超10亿,大家都在拼命拼产能、比出货量,但你好像并不认可这个观点。
许华哲:对,这还是我想讲的。我觉得最理想主义的事情反而最切实际。我们去看拼产能,什么是拼产能?就是我要造出更多的机器人。那我造出更多的机器人,我到底用在哪了?其实很难说。
我很关注一个数据,但我可能永远拿不到,叫做“机器人日活”。我卖出去的机器人,它每天的活跃比例是多少?有多少人每天在用它?有多少人一个月用它一次?有多少人放在那儿一年不用?
拼产能应该是一个结果,不应该是一个目标。它是一个顺带的——我的机器人有了大量的需求,所以我要拼产能,要把它卖出去,而不是说把产能定成目标。
另一方面,追求通用才有可能到真正意义上拼产能的阶段。它好用,无论是B端还是C端,用户真的愿意买单。
大模型给了我们很好的启示。如果我去做智能客服,我永远都做不出来一个GPT式的大模型。当时看,做智能客服是比较现实的,但理想化的东西是一个GPT,当时看来是“你为什么不做智能客服呢?”
这个东西是有很大的风险,但往往风险最大的东西,有可能最实在。
凤凰网科技:你想做的是具身大模型?
许华哲:我们想做的是通用的家庭机器人,具身模型是里面的核心部分,我们也会做自己的硬件,也会把产品本身定义好。
目前,我们在做自己的手,因为我们希望用数据来定义手的样子,反向地用AI来定义,到底该怎么设计这个机器人。同时我们也在做自己的模型,去做操作任务上面很有挑战的方面,让它极致的灵巧、极致的泛化、极致的成功率和效率。
灵巧手比较小,想做到人的大小需要很多微型电机,电机的排布也非常有讲究。人手的自由度又非常高,控制起来也颇有难度。
凤凰网科技:感觉你更认可在真实情况下采集,而不是仿真数据。面向家庭的话,数据采集是不是更难?
许华哲:反而未必。大家有时候很喜欢直接用一个数字来说我到底有多少小时的数据了,(但)这个是一个过程指标,不是一个终局指标。我真正在乎的是我有多丰富的数据了,而不是我有多少小时的数据了。
我完全可以放一个机器人在工厂里每天拧螺丝,100个机器人干一个月,那我的数据量就已经非常高了,但这样的数据没有任何意义,它只对拧螺丝这件事有用,丰富性是非常差的。
在丰富的前提下,我们才去看小时数——因为它丰富了,所以小时数也就上来了。
在家里面,天然的,就不可能是同质化的数据。不同的人的家里,不同的物品、不同的任务,都是很丰富的。在家里机器人能越用越聪明。
它最开始肯定有犯错误的,这部分数据也可能成为机器人进一步发展智能的燃料。也可以把日常第一人称视频数据采集下来,用作燃料,效果也可能非常好。家里的数据并没有那么难以获取,有的时候甚至是更容易获取的。
凤凰网科技:工厂场景比较模块化,家庭场景你们怎么建构数据采集?
许华哲:我们的办公室未来会是一个家的样子,未来也许会看到机器人跟我们的工程师一起在客厅干活。我们会尽可能找到各种各样家的场景,去做数据的采集。
另外刚才提到的,其实家的数据就是人的数据,就是每一个普通人的数据,所以我们也会积极地想,怎么样让每一个人加入到我们这个采数据大军里。
相反,工厂场景是因为它比较清晰、比较模块化,所以针对这个场景很容易采到数据。但这个数据到底能不能带来足够好的物理智能?这个未必。我更看重数据的质量,而不是它的数量有没有那么容易获取。
凤凰网科技:那目前机器人进家庭这件事,最难的卡点在哪里?
许华哲:第一个是智能本身的泛化性、通用性。第二个是产品定义——有了足够好的智能,这个东西到底怎么样对人类未来的生活产生改变,这件事是没有任何人给出明确答案的。第三个是可靠性,但这个可靠性得比上春晚的可靠性要再高一个台阶,安全、隐私——这两个问题在家里面是需要解的。尤其安全问题,我们不希望这个机器人突然摔倒,因为家里面可以躲的空间更小了,也不希望它的电池起火。
凤凰网科技:要解决技术上的通用泛化性,现在有哪些解决路径?
许华哲:路径万变不离Scaling Law,首先要有足量的数据,其次要有比较大的模型。但在具体的算法选择、模型架构上还是有很多可以变化、可以重新思考的地方。另外,把每一个环节做扎实是特别重要的。
我有很多做大模型的朋友,他们说大模型里面没有秘密,但就是有的人做得好,有的公司做得差。做得好的公司可能就是在爬数据的时候有某个技巧,或者洗数据的时候洗得更好。每个地方做得足够扎实,也能使模型变得更好。
凤凰网科技:很多人都说算法的壁垒周期只有几个月,很容易被别人赶上。你赞同吗?
许华哲:一定程度上,算法的壁垒主要因为技术会扩散。算法本身一定是没有办法永远作为一个壁垒的。但是算法带来的领先性会相伴随,会使得你获得更多的支持,会有一个更好的身位。
一个很好的例子是DeepSeek。它本身是一个开源模型,在去年春节的时候爆火。一定程度上它的模型并没有一直维持在最领先,但它奠定了一个基调,或者大家对它产生了一种信任,叫作“中国最好的模型很有可能持续在那发生”。这个信任的场是非常重要的,而这份信任场可以是一个壁垒。
凤凰网科技:你说过只有你能做这件事情,你觉得自己的优势点在哪里?
许华哲:我更知道我追求的那个未来长成什么样。不是说只有我能把这事干成,而是每个人追求的那个未来的画面是不一样的。
首先我是有技术信仰的。非常有帮助的一点在于战略定力。在你做了一些事情之后,会有很多噪音涌过来,这儿好像也能有一些收益,那儿好像看起来也是对的。今天他给你介绍一个朋友,明天他说我有一个资源方跟你聊聊。当然这些都可以聊、可以接触,但是否会偏离你的北极星——技术上的北极星或者产品上的北极星,这个判断是需要你有一个信仰存在的。不然很容易就拐到了一个永远到不了你真正目标的地方。
第二个,我是非常有共情能力的一个人。做To C一定程度上不是讨好谁,也不是卷死谁,而是怎么样做出一个好玩的东西、好用的东西,让很多人跟着共振,觉得太酷了,我太想要了。这样的东西你没有办法去盯着某个人去优化,因为你要的是这个世界所有人,比如70亿人看到了以后,有1%或10%的人觉得我想要。共情能力在里面是非常非常重要的。
第三是技术本身。因为我本身也在高校,对技术有非常多的积累,对模型很多细节做了非常多的研究。
最后是某种意义上的技术号召力。这是一个很软性的东西。但是当我说我要创业的时候,会有很多小伙伴说,听说你要创业了那我就来吧。也没有问你要干嘛,也没有问要付他多少钱,因为知道我不会给一个很糟糕的待遇。甚至连base都没有问,我说可能清华附近的一个楼里,就说那行下个月我回到北京,来你这儿干。这种技术号召力,一定程度上保证了我们的人才密度持续领先。
凤凰网科技:可以具体讲讲你的技术信仰是什么吗?
许华哲:从大到小来讲。第一个是相信物理的AGI的可发生性,它最终一定会实现。如果首先不相信这件事,会产生很多困惑,会在中途有很多犹豫。
第二是更小一点,相信物理的AGI会在我们这儿发生。在有了正确的人、正确的数据、正确的模型之后,没有道理它不发生。所以不去担心,不去被那些令人焦虑的噪音影响,也不去做快速的跟随者。我们从第一性原理去想,怎么样让那件事发生。
第三是相信强化学习。我始终认为我们在这个世界学习,或者在世界产生智能,某种意义上都是强化学习——我在这个世界交互获取数据,在有了数据之后,我对这些数据有一些反馈,那些让我疼的、让我难受的、让我饿的都是坏的数据,那些让我开心的、让我成长的、让我变强的都是好的数据。
我交互获得数据、评估数据,最后根据评估来从数据中汲取压缩出精华,成为智能的一部分。本质上对于强化学习的相信是,我对中间的价值函数或者价值评估的存在,认为一定是有它的意义。
凤凰网科技:在具身赛道,大家的北极星似乎都是一颗,但到达的路径不同。目前还是技术未收敛的状态,这个阶段对不同玩家来说意味着什么?
许华哲:对我们来说客观上是好事,因为没有收敛,大家没有看到明确的路径,所以仍然可以还是玩家。我们在今年出发,仍然有很大的机会去让那件最大的事情发生在我们这里。
对于大家来说,也是一个群雄逐鹿的状态,所有人都在沿着自己的信仰,沿着自己认为可以成功的路径,去做技术、做市场、做商业,这是对判断力的考验。很多时候,工程上可以依赖AI的工具,商业化上大家也都还不太成熟。最核心的是,你的判断是否准确。判断准确,就能让你的组织在正确的时间点做正确的事情。

“大模型是核武器级别的东西,一定要选善良的人”
凤凰网科技:你曾提到中美相比,我们在人才密度和AI的创造性、突破性上仍有差距。为什么?
许华哲:我觉得人才密度也没有很低。差距在于土壤,就是我有多大的自由度可以探索一点东西,这对很多从0到1的事情来说,是重要的。
我在伯克利读书的经历让我有一种感觉……我从博一开始就没人管我。我的导师不会给我说到底该做什么,而是让我说觉得应该做什么,然后他再来否定我,说你不应该做这个,直到我说出一个东西,他觉得OK,这件事好像可以做,但你说的也不完全对,我可以带着你把你说的这件事做对。
这个过程是很宝贵的。所以我回国之后也希望无论是学校还是公司,能有这样的一个土壤。在我的Lab里,我也会经常启发式地跟大家聊,让大家找到属于自己的那个事儿。
这才能叫做人才——因为他找到自己的事情并且自己做出来,而不是说所有的事情都是我找到,我给你了,你去把它做出来。(中美)水平上面是不相上下的,但可能就缺一点这种找到自己的事情的部分。
凤凰网科技:你之前提到工业界和学界有代际差,现在你既是清华老师又身兼创业,你认为学界和业界在这波浪潮中如何更好地互动?
许华哲:具身智能或者说AI是一个独特的行业,它没有那个代际差了。在传统行业里,实验室会做一些高风险的探索性事情,可能100件里只有1件能成功,这个小成功率的东西会被交给工业界发扬光大,学术界接着探索下一个高风险的事情。
但人工智能的特殊性在于,那件高风险的事情同时有巨大的商业价值——它不是我探索出来了一个东西还需要大量产业的人去做转化,有的时候那个模型或者是那个事发生了,它立刻就有商业价值。
在学校里,往往很难获得足够的资源。一定程度上现在工业界和学术界在人工智能这个行业里面在做同样的事情。只不过学术界大家可能自由度更高一点,工业界大家稍微更收敛一点、更聚焦一点,资源更多一点。
凤凰网科技:这也是为什么现在具身赛道这么多学院派出来创业的原因吗?
许华哲:一定程度上是的。
学院派出来创业有几个点:第一,AI创业一定需要远见,vision,能看得到未来终局长成什么样,这是最重要的能力。第二,在学校里很多时候资源是受限的,尤其是年轻的老师们,在学校里是不可能训出一个超大的模型的。第三,现在年轻人不太一样了,大家想去做一些了不起的事情。不太在乎这份工作稳定不稳定,更多想的是这个事本身意义大不大。
我创业这事,跟我爸妈聊,他们肯定是说支持,但你要不创业也不错,因为在他们的视角里,在清华只做教书这一件事,对他们来说也足够好,甚至会是更好的选择。
凤凰网科技:现在很多人甚至认为学上不上也无所谓,只要我有想法、有能把想法落地的能力,就可以辍学借助AI实现梦想。
许华哲:对,博士生会转成硕士毕业,助理教授会自己创业,有时候本科生也会创业。目前身边退学率也越来越多了,我觉得是一个非常好的事情。因为我们更在乎实质了,而不是在乎被打上那个logo或者标记。
我并不在乎未来我们招人的时候,你到底是高中还是本科,还是硕士,还是博士后,还是一个教授,这个对我们来说不重要,而是看你到底在AGI的这个事业上、这个道路上你能产生多少力量,你能做出来怎么样的贡献。这件事也是近几年发生的一个变化。
凤凰网科技:你选人的判断标准是什么?
许华哲:善良是我这的一个大前提,就是不是来作恶的。在这个基础上,现在更火的词叫agency,但我觉得中文词更好一点,就是主观能动性。我觉得一个人能折腾、爱折腾、主动地去折腾,对我来说特别重要,因为这意味着他会不停地把自己边界往出突破,可以做出更了不起的事情。
第三个是好的品味。在纯技术、纯理性来看这叫判断力;如果你放在整个世界所有的领域来看,叫做品味。因为最终的一切都是由你的品味决定的。品味好和坏最后决定了你产品的一切。
有一次,我跟一个博士生在底下散步,他挺焦虑的,说新来的同学有几个特别卷,我也不是那种特别卷的人,是不是有点跟不上节奏?我说完全不会。我说,你平时听贝多芬,你读陀思妥耶夫斯基,我不觉得你会做出糟糕的科研,因为你的品味在那里。
你如果做出一个垃圾的科研,你自己会受不了,你是没有办法容忍那样子的自己的,因为你知道什么是好的,什么是美的。品味对我来说是非常核心的一个要求。
放在一起就是,初心是善良的,能量上是主观能动性很强的,品味是足够好的。
凤凰网科技:这个标准是选博士生还是在选员工?
许华哲:都是。
凤凰网科技:这两件事是一样的吗?
许华哲:当然不一样,但作为一个人来说,一定程度上是一样的。因为我们这算是高科技行业,到来的人很有可能对人类产生很大的影响。
博士生也是,员工也是,如果他不是善良的,他很有可能是作恶。大模型完全是一个核武器级别的东西,未来的机器人更可怕,也许就是你这个公司控制着整个社会的相当一部分的机器人在运行。如果你是邪恶的,是没有办法被接受的。
第二,主观能动性上一样。在公司里会有很多缝,在科研上也有很多缝。
什么是缝?就是我有一个主线任务,你有一个主线任务,但咱俩沟通的过程中会有一些既不属于你也不属于我的事,那谁去做?真正想把这个事情做好的人是不会问的,两个人都会抢着去做。或者说,我看到一个事情是一个正确的路,是不是要自己去试一试,还是等着你来告诉我去做才去做?这个无论在科研上,还是在公司里都是一样重要的。
品味也一样。科研需要他的工作品味,产品也需要他的工作品味。乔布斯自己也说过,ultimately it's down to taste。
为什么苹果的电脑你摸上去就觉得有一种质感、有一种高级感?某种意义上你也可以给它做得很粗糙、很粗线条的,这是你自己的选择,你品味的选择。
这是我对人的选择。甚至对朋友我有时候都会感受一下这三条。
凤凰网科技:不作恶也是很多公司的底线标准,但我们现在能看到,AI发展速度让一些不想作恶的人已经慢慢觉得自己的存在感不强,比如OpenAI的研究员离职。你会担心在具身赛道重演吗?
许华哲:首先我是一个技术乐观派,我认为技术是应该发展的。其次我认为发展了之后,我们总有方法对它进行治理的。发展和治理可能同样重要,但我倾向于先发展再治理,在还有没有任何东西的时候就治理,会限制发展。这也是为什么某种意义上,人的价值观是最重要的。
有没有可能我们治理不了它?这件事目前来看还没有出现,但也说不准。大家都说有一个奇点,到来时会发生一件事。我们造出了一个AI,但这个AI比我们更聪明。所以它会造出一个比它更聪明的AI。
既然我们能造出一个比我们更聪明的家伙,那它就能造出一个比它更聪明的AI。这样无限迭代下去,就会在10个轮次后出现一个全知全能的家伙,可能远超我们的控制。这个事我觉得是有概率发生的,但至少目前还远。

“不能人海战术,意味初创公司机会更大”
凤凰网科技:除了像你们这种学院派的初创企业,大厂、车企、手机厂商都纷纷入局,留给初创公司的空间还大吗?
许华哲:仍然是大的。大厂的加入一般是要等待一个信号,就是它可以成为公司的一个主线,或者是马上要濒临成功、会面向一个巨大市场的时候,是开打了的信号,是要成了的信号。你会看到,大厂在大模型上的竞争是白热化的,在具身上的竞争是有,但没有白热化。所以(目前)具身的发展阶段还是给了我们一些战略时间、战略空间。
其次,人工智能的研究也好,具身智能的发展也好,核心是一小撮高浓度的智力密集的小团体,能够决定非常大的事情。所以它不太可能像造车这样去堆人,然后在成熟的产业上把这个事迅速做完。大公司调出来几千号人,可能还不如那50个人干出的成果。
所以无论是谁来了,都需要这样的一撮很好的人。这其实是增加了门槛的,因为不能人海战术意味着创业公司的机会更大。
凤凰网科技:我们之前跟松延动力的姜哲源聊过,他认为2026年是一个关键节点,也是具身赛道淘汰赛的开始,有一批公司可能会撑不下去。你怎么看2026年的竞争态势?
许华哲:我们是不是应该晚一年开始,等淘汰赛结束我们直接踢决赛?(笑)
最先撑不住的是哪类公司?有两种:一个账上没钱了,所以融资能力差的公司会倒,因为没钱了,没办法再持续做事了。
第二类是士气没了。可能账上还有一些钱,但已经没有人相信,甚至包括他们自己也不相信能做出新一代的东西了。还有一类,就是持续没有展示出一些超过预期的东西,以及在落地上也没有落成,卡在中间的这样一些公司。
凤凰网科技:你会觉得具身赛道被资本催熟了吗?从技术上看这是个很早期的行业,但大量钱涌入,甚至有公司要IPO了。
许华哲:资本肯定起到了一些促进的作用,让具身行业有了更多的资源。至于IPO的选择,见仁见智。但我更愿意乐观地、积极地去看这件事,因为本质上具身智能的竞争和大模型竞争都是未来话语权、定义未来的竞争。所以我更愿意把这些投资机构给的这些钱看作是我率先给你一些钱,然后希望你为我争夺未来的话语权。
为什么?比如说我们就看中美,美国也一样的,OpenAI每次融资都是上千亿美元的量。如果中国这边不是有足够的资本去支撑,这个结局就已经定了。所以我们是需要这样的支持的。只不过现在有点百花齐放。我觉得未来可能会达成一些合作、一些联盟,甚至一些合并,最终还是需要资本的助推,才有可能在定义未来这件事情上有足够的声音。
凤凰网科技:你现在出来创业之后,怎么平衡担任老师的职责,精力怎么分配?
许华哲:我真正想做的事情就是通用的智能。所以一定程度上我没有特别去想这件事,我想的更多的是。能不能让通用的智能发生在我们这、发生在中国。
无论是在学校还是在公司,还是在社会里,都是一个共同的目标。这个地方我有一个暴论:职业这个东西本身是没有意义的。本质上一个人应该可以干任何事情,只不过为了方便运行或者提高效率,每个人有了职业。但你自己也可以看到,我自己也在做播客,我也把自己叫做一个媒体,我也教书,也做研究,我也创业。
我觉得一个人不需要有职业定义。我在企业里我仍然很享受教书,我在学校里我仍然可以去做商业。职业是为了效率而异化出来的东西,作为人不用太在乎这个。
凤凰网科技:能看到你最早在小红书做Ask me anything,包括有自己的B站账号、播客,非常乐于跟年轻人交流。还曾说要“祛魅”,但你本身就是精英履历。
许华哲:我承认我的履历一定程度上就是精英的某种定义:清华,然后去伯克利、斯坦福,又回到清华,又去创业。但我要去的就是我们这些人的魅。
大家会有这样的过程,我自己也会有。当我在清华读书的时候我会觉得,那些未来比如伯克利的老师得有多厉害?我去了以后发现也没有那么值得神话。到了斯坦福也是一样。再到创业,你能看到更多平时见不到的人,你会想他们一定很不一样。
有时候人和人之间没有那么多差别,最终还是看你做的事情决定的,不用去盲目迷信一个什么人。如果你确实很喜欢一个人,且在信息充足的情况下很喜欢一个人,那个人才是值得去追随的。如果是在信息不充足的情况下,往往是被捏造出来的一个虚假的形象。
凤凰网科技:你有被“魅”困住过的时刻吗?
许华哲:小时候有。就会觉得怎样的人就一定很厉害,他说的一定对。但后面回头看发现,只是在那个时候的我眼中他是厉害的。你每一个阶段都会有一个自己的“魅”,但是如果能早一点想到,其实他们只是比你早生了几年。想清楚这件事,就按照自己的节奏努力就好了。
凤凰网科技:除了身边这些人,你有精神偶像吗?
许华哲:我一直很喜欢贝多芬。
凤凰网科技:但你没有去学音乐。
许华哲:我其实有想过。我从小一直练钢琴,在伯克利期间我也修了几乎所有音乐课,一度想要不要再申请一个硕士试试看。很喜欢贝多芬的一个原因就是他的愤怒常在,他像是一个既规整又愤怒又深刻的一个家伙,写的东西情绪总是很饱满,并且他在思考一些,人为什么应该这么做,为什么要经历这些问题。
我还很喜欢拿破仑。很好玩的是,贝多芬曾经写过一个曲子给拿破仑,但是后面他听说拿破仑要称帝了就给划掉了,就变成《英雄》嘛。本质上在我心中他俩都有点像,那种对这个世界一直有着征服欲,有着愤怒,但同时也有深刻思考和善良的一部分。
凤凰网科技:能从你的选择看出来,你的兴趣非常丰富。你之前是电子系,是吗?
许华哲:对,本科是电子系。选择电子系是一个很随机的事情。因为我知道我想做IT,就是高中的时候。因为在马桶读物里,我的一个很重要的马桶读物就是人物传记,《乔布斯传》《比尔盖茨传》《迪士尼传》,包括《拿破仑传》。
一个很重要的点就是我发现,IT创业是一个非常有趣的事情,也是人类很未来的一个事情。所以我从小就很喜欢,很想做这件事。但是为什么我没有选计算机系,而选了电子系呢?因当时听说,电子系不用上化学课,就这么简单。
凤凰网科技:后面的选择路径都是你有意为之,还是凭喜好?
许华哲:五五开。我高中时候第一次知道人工智能,到了本科阶段在电子系就是认认真真学电子系的课了。大三去多伦多大学交换了一次,第一次上了一门课叫计算机视觉,用了一个东西叫深度学习,2015年给我带来了挺大的震撼,原来AI这么厉害。计算机视觉的深度学习模型这么厉害。那个时候就觉得OK,小时候看的那些科幻里的东西是有可能做出来的,虽然不一定是我,但我至少试一下。

“绝对不能我们造身体,等美国造大脑”
凤凰网科技:你在《具身智能2025的回望》中写到,觉得2025年一个很明显的分歧是中国具身公司花更多时间在量产,而美国公司展示技术上限。你担心我们可能会错过那个“最大的西瓜”,这是指什么?
许华哲:智能本身。量产,归根到底是产生一大堆铁疙瘩。铁疙瘩本身是没有意义的,它必须要有那颗核心,就是它的智能,才变得格外有意义。我去做大规模的量产,我的智能到底水平怎么样?
这不是我要想的事,而是所有的从业者要想的事。我们应该去争夺的或者努力的是那件最大的事。所谓的“最大的西瓜”,是希望我们在智能这件事情上占领一个高地。
美国的很多厂可能受限于自己的供应链短板,没有办法做量产,或是没有办法造出硬件,所以可能选择智能也不是有多有理想,而是就是没得选择。
但是我们不能被这个天然的——因为我们供应链很好——然后就只做这个。
绝对不能是我们未来造身体,然后等美国人或者美国的那些公司造大脑。绝对不能是这样,还是得自己把这些东西都做出来。
凤凰网科技:感觉你多次提过中美差距,包括创新落后的焦虑,这种焦虑感是从哪来的?
许华哲:我一直觉得我们在水平上,在人才密度上,在硬实力上没有差距的。在2023年起跑的时候,我们几乎是并跑,就是在一起竞争。
但是到2025年的时候,我会发现,PI、Sunday、Generalist这些美国公司确实看起来好像更好一点,就是智能的能力。当然我们也有我们的宇树,全世界最好的武打能力,就运控。
所以一定程度上,我们是选择了不同的路线,但我觉得智能是更本质的事情,所以我才产生了这个焦虑——明明我们是一起开始的,不要因为我们忘记了这件事导致落后。因为我们明明可以跑得一样快,或者跑得比他更快的。
凤凰网科技:你从学界和业界双重身份看,差距是从何而来的?
许华哲:应该是一种,大家从第一性去定义我到底希望未来长成什么样,反过来推我要做什么的能力。而不是别人做了一个什么,我们要立刻有别人有的这个东西;别人做了这个,我去想我到底未来最重要的事对我来说、对我们来说是什么,然后我去反过来推,我可以做跟他一样的事,也可以做跟他不一样的事,但这得是我自己思考出来的。这很核心的。
或者说,现在如果有一个人,告诉我量产和运控就是未来最重要的决胜点,我会很乐意听。但是你不能告诉我——因为我正好擅长这个,我就做了它,或者说因为别人做了什么我就做了这个。而是你有道理地给我讲明白,为什么这个是最重要,那我会承认你是对的。
凤凰网科技:你对AGI的预期,2026年是比2025年更乐观了,还是更悲观?
许华哲:当然更乐观了。AGI的能力越来越可怕了。最近龙虾批量爆火,当然我不太用OpenAI的,我用别的Agent。真的很好使了。比如说在飞书里面接入一个东西,让它帮我总结开会的东西,帮我约时间放在日历上等等。
原来这些琐碎事情我一直很想有一个助理,但好像有点装,所以我从来没有过。现在太好了,我既可以不装又可以有助理了。这就是AGI到来的一个前哨。我会有更乐观的预期。
凤凰网科技:GPT出来之后,很多海外大学老师会禁用的,因为他们担心学生用AI偷懒。作为老师,你会有这种担忧吗,觉得学生过度依赖AI会丧失独立思考?
许华哲:我在我的上一节课刚刚跟大家说,如果你的作业是完全用AI做的,并且你把这个过程用视频录下来,我会直接给你满分。这是我的一场实验。
我相信清华的同学们都能学得会原理,写代码的这个过程未来就是AI来写,你只需要懂原理就好了。懂了原理以后,你给它正确的指令、正确的prompt,让它帮你干正确的事情,把这件事完成,这就是未来的工作流。
我不觉得这是学术不端,我反而觉得如果你的作业用AI彻底从头到尾完成,你会是一个属于未来的人。
凤凰网科技:大家困惑在于,论文之前是人类独创思维的凝结,但借助AI的话,版权到底属于谁?
许华哲:版权问题是一个很层层嵌套的问题。那个模型本身也是拿的别人的版权,你再用这个模型干你的事,所以这个版权很难说归属于谁。但这个趋势是不可避免的。论文层面,最核心的那个东西还是属于人类的,但是比如做实验这些事,你完全可以用AI来帮你做实验。
再激进一点看,最近有一个东西很流行,虽然还很不成熟,叫Auto research。人给它一些指令,说你看这十篇文章,是这个领域里比较重要的,我要做一个什么样的工作,你根据它们复现一下,跑一些实验,调优一下,给我写一篇技术报告,然后它自动生成一个论文。整个科研人只需要描述一下,剩下就是AI自动去做了。
一旦变到这样的话,没有人会再去争那个版权了。未来都是AI在批量地优化。人在最后争的那个版权,可能是那种最难或者最有挑战的那一部分。
水位线从可能原来30%原来不是人类的智慧结晶,涨到了99%,只剩下那个1%是人类的智慧,剩下就是AI在干,你也不需要再想了。
凤凰网科技:那中间被牺牲掉的人去干嘛呢?
许华哲:两种:一种是大家都去往那1%去争,就是让自己变得更聪明,去学得更深入、更思考得更深刻,才有可能带来价值。另一个就是享受这种新型劳动力带来的红利,享受人生。也有可能,这个未来形态不确定。
未来可能会变成一个哑铃型,而且是头小底大的哑铃型。中间的事AI全做了。如果具身智能再发展出来,脑力活、体力活AI都做了——大多数人更多就是享受人生了。
也许我下围棋永远都下不过AI,但是我还是想下围棋,因为觉得下围棋很有意思,可能是这样子。还有最上面的一小点,仍然是AI没有办法替代的。
凤凰网科技:大家焦虑的部分在于自己可能被AI替代,现在有很多因为AI失业的案例了。
许华哲:所以就是当汽车到来的时候,就别再当马车车夫了。也别想着把我的马换成汗血宝马,都没用;也别想着我换一个好的鞭子抽那匹马,都没用。就是想办法拥抱AI,成为驾驶汽车的人。
凤凰网科技:之前你和马拉比聊新书《哈萨比斯:硅谷AI之脑》,那场对谈中收获最大的是什么?
许华哲:两方面,一方面是哈萨比斯,一方面是马拉比。关于哈萨比斯我很受鼓舞和触动,是他对AI近乎虔诚的宗教式的追求,需要这样对智能的不懈追求,才有可能做出像他那样的成绩。
关于马拉比,他的报告最后很有意思,他很反对开源。他说,大模型就是这个时代的核武器,中国和美国做得很好,所以中国和美国应该自己管理和整治好大模型。开源有可能让新时代的核武器流入坏人之手。比如说坏家伙,用开源去作恶。
这个事情对我冲击很大。因为开源一直是我们这个行业的信仰。我作为一个搞计算机、搞人工智能的人,一直觉得我开源,我自豪、我骄傲,我让全世界更多人用到这些美好的东西,世界才发展得越来越快,人们的生活才变得越来越好。
但他觉得,这个东西太大了,以至于开源反而是坏事。因为好人未必能拿它做出更好的事,但坏人很轻易可以拿它做坏事。我也在重新想这件事,但我还没有完全被说服。
凤凰网科技:听上去像是性恶论和性善论的一个对决。
许华哲:某种意义上是吧。
凤凰网科技:哈萨比斯书中讲到,当AlphaGo打败世界冠军的时候,在围棋领域的AGI已经实现了。当人类社会所有维度都实现AGI,人类会失去控制权吗?
许华哲:关于这个有很多很多的想象。我记得读阿西莫夫的书里面,他有一种想象很有意思,大概是有一个银河帝国的地方,有一个总管人类的,叫他国王也好,叫他什么都好,反正就是有一个很好的家伙,把这个地方治理得很不错,但最后发现是一个机器人。
那就有人问,机器人统治人类这不是已经倒反天罡了嘛,人造出的机器人。机器人三定律外,还有个第零定律,叫机器人不能伤害人类整体。
如果我是一个人,但我很邪恶,我去跟这个机器人说,你去给我干点坏事。这时候机器人不能去干,因为这样做,伤害了人类整体的利益。
所以最后机器人就琢磨,人类可真不行呀,怎么天天你打我、我打你的,整这些资源争夺,不如我来把大家都运行起来,反而人类变得最好。这样就是一个很悲惨的结局了。机器人为了服务人类,但因为人类本身的缺陷,使得它最后决定以某种方式自己成为整个人类的统治者。这是一种可能性。
另一种是Geoffrey Hinton,他之前一直担忧AI过于强大,最后得出一个结论叫做motherhood,母爱,是指机器人对人类应该会有一种母爱式的情感在。它脱胎于人类智能,诞生于人类数据,对人类是有一种想要呵护的感觉,所以会一直做好事。因为它对人类产生了丰富的情感,并且保护人类。这也是有可能的。
当然还有一种就是反叛军。穿越回来,比如说到我们公司来,说今天必须得干掉你了。为什么?因为20年后,机器人就统治了地球,所以今天必须要干掉你。有很多想象。
但我觉得失控的概率不是很大,因为毕竟目前,还是只要拔了那根电源线就好了
本文转自:凤凰网科技
原文地址: https://tech.ifeng.com/c/8sey1IIaI9E

小同爱分享2 个月前
疫情,就是让人抑郁,又没了感情。 - 小同爱分享
小同爱分享2 个月前
所谓生活不如意,就是缺少人民币。 - 小同爱分享