当前,已经没人会怀疑AI对生产力的促进和突破作用,AI所代表的先进生产力,也成为了新一轮国际竞争中,所有势力竞相追逐的明珠。时至今日,数字AI的革命性力量已经逐步冲破虚拟世界的边界,越来越多地交互并改变物理世界。而这,就是物理AI。

在十四五工作总结强调“创新驱动发展”的背景下,物理AI作为新质生产力的重要组成部分,正成为中美科技竞争的新焦点。这一背景下,中国科技企业正从跟随者转变为引领者,将硬科技与智能化深度融合,抢夺下一个技术突破的制高点。其中的先行者,就有小鹏。

就在刚刚过去的11月5日,以涌现“为主题的2025小鹏科技日在广州举行,小鹏汽车董事长何小鹏正式宣布公司定位升级为“物理AI世界的出行探索者,面向全球的具身智能公司”。这一战略转型背后,是小鹏发布的四项重要物理AI应用——第二代VLA大模型、小鹏Robotaxi、全新一代IRON机器人以及汇天两套飞行体系,勾勒出未来出行的清晰图景。

物理AI:数字与物理世界融合的必然趋势

自2000年以来,人类历经了从互联网、移动数字互联网到数字AI时代的科技浪潮变迁。然而,即使当前AI已在某些领域展现出超越人类的智慧水平,但由于受限于数字世界的边界,其与现实物理世界的交互能力仍然有限。因此,下一个科技浪潮必然是AI的“物理化”,正如小鹏汽车董事长何小鹏在科技日演讲中指出:“只有给AI赋予身体,才能将AI的能力从数字世界拓展到物理世界。”

物理AI的本质,在于让人工智能具备感知、决策与执行的完整闭环能力,使其能够在真实物理环境中自主完成复杂任务。简单来说,就是让AI“具身化”,让其能够通过汽车、机器人等载体,将AI的认知能力转化为改变物理世界的行动力。同时,通过融合传感器、机械结构与深度学习算法,物理AI不仅能够理解环境,还能与之互动并持续进化。从数字AI到物理AI的转变,可以说是AI从“看见”世界到“进入”世界的跨越。

物理AI的兴起并非偶然,而是数字技术发展到一定阶段的必然产物。尤其是在当下大模型数字AI已经发展到一定的阶段,各家都在推出自己的大模型的时候,模型本身的源代码已经不是最重要的,反倒是依托在模型上、紧跟着操作系统的数据,成为了推动AI乃至生产力发展和进步的“燃料”。也正因如此,数字世界的操作系统加上数据的下一步发展必须与物理世界的运动能力组合起来,一方面拓展物理世界的能力边界,另一方面也能从物理世界源源不断地收集新的数据再度进化。当AI不仅能够理解世界,还能通过具体载体改变世界时,其价值将呈指数级增长。这正是中美科技企业竞相布局物理AI的根本原因。

目前,发展物理AI的趋势已经成为全球科技竞争的焦点,而中美科技巨头在这一领域的战略布局则呈现出惊人的相似性。此前,特斯拉在《宏伟蓝图4》中就明确表示,公司未来的价值中心将逐步从车辆和能源领域,转移到人形机器人 Optimus。而小鹏此次宣布将自身升级为一家“物理AI世界的出行探索者,面向全球的具身智能公司”,也展现了同样的战略视野。就像何小鹏所说:“未来的汽车将是四个轮子的机器人”。

成立11年以来,小鹏以汽车立身,打造了包括轿车、SUV、MPV在内多品类的完整产品矩阵,还具有国内领先的智驾系统。同时,在飞行汽车、robotaxi和机器人方面,小鹏也进行了超前布局。显然,作为物理AI能力落地的关键基础,小鹏的硬件能力在全领域布局下,已经形成了规模化的效应,而在软件领域几乎是下血本程度的投入,则让小鹏拥有了行业领先的“操作系统”,构建起软硬协同的全栈自研能力,最终带来了此次小鹏科技日上的多项重要技术"涌现”。

第二代VLA大模型:小鹏物理AI体系的技术基石

在小鹏构建的全栈自研物理AI体系中,第二代VLA(Vision-Language-Action)大模型毫无疑问是最为核心的技术突破。与行业主流VLA架构相比,小鹏创新性地去除了“语言转译”环节,首次实现了从视觉信号到动作指令的端到端直接生成。

这一架构创新的意义深远。传统VLA模型采用“视觉→语言→动作”的转换流程,不仅导致大量视觉细节丢失,还增加了推理延迟。而小鹏的第二代VLA采用“视觉+语言→隐式Token→动作”架构,减少了传统VLA的语⾔转译环节,不依赖⼈类语⾔作为中间媒介,有效解决转译延迟带来的执行效果不佳等问题,让AI能够像人类一样直观感知并决策,实现了更本质的物理世界理解。

此外,由于第二代VLA大模型能够直接识别视觉细节,因此能够在⼤规模数据中⾃主学习驾驶所需的所有知识,包括物理规则、交通信号的语义、⻋辆动态等,从学习人类语言描述的场景,变为直接学习真实的物理世界,形成⼀个更接近本质的物理世界模型。在此基础上,由于第二代VLA大模型能直接输出动作指令,让其具备在物理世界中直接控制大型硬件物体的能力。同时其能力范围也不仅仅局限在智驾领域,而是能够扩展到更多物理AI领域,例如小鹏的IRON机器人、Robotaxi和飞行汽车。

支撑这一巨大突破的,是小鹏强大的算力与数据平台。小鹏通过巨量的算力投入,建立了国内汽车行业首个万卡规模智算集群“星云”,并将其命名为“云端模型工厂”。目前,小鹏拥有全球领先的3万卡云端算力集群,部署了720亿参数的自动驾驶云端基座模型,可以实现每5天就实现1次全链路迭代的能力。

同时,在模型训练层面,由于第二代VLA能够直接利用无需人工标注的真实驾驶视频进行训练,因此其数据训练量也得到了指数级的增加。据称用于第二代VLA的数据训练量接近1亿clips,相当于人类司机驾驶65,000年才能遇到的极限场景总和。特别值得关注的是,小鹏实现了“芯片-算子-模型”全链路优化,在算力达到2250TOPS的车端上,部署了数十亿级参数规模的第二代VLA模型,而行业平均水平仅为千万级规模。

而在实际应用中,第二代VLA展现出令人惊喜的智能涌现能力。比如,小鹏即将发布的“小路NGP”功能将复杂小路的平均接管里程提升13倍,实现真正丝滑的车位到车位体验。同时,第二代VLA还涌现了全新的智能体验,比如识别手势进行靠边停车,通过人行道红绿灯预判车道红绿灯变化等未经专门训练的复杂场景。这种能力的涌现,证明了小鹏在物理AI技术路径上的又一重大突破。而基于对物理世界的理解,小鹏第二代VLA还可推演未来决策场景,并且还可实现生成更真实的长尾场景进行对抗训练,从而大幅提升应对长尾问题的能力。

而以上这些,还只是第二代VLA大模型在智驾领域的应用。实际上,小鹏在物理AI的前沿布局远不止智驾。

三大具身智能产品:拓展物理AI的边界

此次科技日,小鹏发布的三大具身智能产品——Robotaxi、人形机器人、飞行汽车,均基于第二代VLA大模型,展现了物理AI技术的跨域应用能力,也展现出其独特的技术路径与商业化思路。

先说Robotaxi,不同于行业普遍的后装改造,小鹏选择了前装量产的技术路线。小鹏Robotaxi搭载4颗自研图灵AI芯片,算力高达3000TOPS,并采用纯视觉方案,不依赖激光雷达与高精地图。这种技术选择不仅降低了成本,更提高了系统的可靠性和可扩展性。此外,与特斯拉的FSD主要面向个人用户不同,小鹏还将推出面向普通消费者,与Robotaxi同源的全新智驾版本Robo,基于Robo,实现共享出行和私人使用大量场景布局,展现出更具开放性和包容性的商业智慧。而得益于前装量产方案和与常规车型分享研发成本分摊压力,小鹏Robotaxi也拥有更加经济的单车成本。

同时,得益于第二代VLA大模型强大的泛化学习能力,小鹏Robotaxi可以快速适应学习不同国家交通习惯和法律法规的能力,能够让Robotaxi的运营范围不再局限于某个特定区域,而是可以跨城市,甚至跨国家的运营,实现全球部署。据悉,光是在2026年,小鹏就将推出三款Robotaxi车型。

此次让许多人大呼“里面有真人”的小鹏全新一代IRON机器人,则实现了“极致拟人”的设计理念。与包括特斯拉Optimus在内的行业其他人性机器人相比,小鹏IRON在仿生结构上显然更为激进。其拥有仿人脊椎、仿生肌肉、全包覆柔性皮肤,全身自由度多达82个,手部自由度则有22个,不但能实现“猫步行走”等高难度拟人动作,得益于全新大模型,其对复杂动作的学习速度也远超过去的人形机器人。而这种极致的拟人化设计,为人机自然交互奠定了基础。

为全新一代IRON提供算力支持的,是3颗图灵AI芯片,有效算力2250TOPS,同时其首发搭载小鹏第一代物理世界大模型,通过构建“VLT+VLA+VLM”的高阶大小脑能力组合,实现“对话、行走、交互”三大高阶智能。此外,小鹏机器人与AI汽车70%技术同源,智造和渠道通用的生态体系,大幅降低了小鹏量产高阶人性机器人的研发成本和量产难度。对于产品的未来,何小鹏表示:“2026年年底,小鹏目标实现规模量产高阶人形机器人。”

值得一提的是,国际科技巨头特斯拉的CEO埃隆马斯克,在通过国际媒体Pandaily得知小鹏IRON机器人后,也隔空与何小鹏对话,称“特斯拉和中国公司将主导市场。我非常尊重中国的竞争对手,中国有很多聪明、勤奋的人”。而中国驻美大使馆同样转发了小鹏的人形机器人视频,足以见得这项超前技术已经获得了从上到下的多方关注与认可。

最后,在飞行汽车这一特斯拉都尚未踏足的领域,小鹏汇天已经通过“陆地航母”和“A868”两款产品展现了技术前瞻性。其中,陆地航母已获7000台全球订单,预计2026年规模化交付;而6人座舱、瞄准商务出行需求的A868,则预计实现500km长航程,最高航速可达360公里/小时,这意味着小鹏在低空出行领域已建立起先发优势。据悉,小鹏汇天将携手敦煌市政府,于2026年推出西北首条低空自驾旅游线路,打造“自驾飞”三维立体出游体验,让飞行汽车走向文旅应用。

在发布会的最后,小鹏描绘了这样一个未来场景:飞行汽车平稳落地后,Robotaxi等候在旁衔接陆地通勤。在抵达目的地后,智能机器人又承接接待、引导等生活服务。从空中穿梭到地面通勤,再到末端生活服务,三者的全场景协同,拓展了未来智能出行的想象空间。

从上面三大具身智能产品的实力和布局中,我们不难看出,相比行业中的其他参与者,小鹏的独特之处在于,通过统一的物理AI技术架构,实现了三大产品线的技术协同。图灵AI芯片、VLA大模型等核心组件在不同产品间高效复用,形成了独特的规模效应。而这种全方向、规模化的产品布局,正在让小鹏在物理AI赛道构建难以复制的竞争优势。

写在最后

小鹏在物理AI领域的技术涌现和爆发,其背后坚实支持的,正是中国完备的能源、工业布局,而伴随着物理AI时代的到来,中国科技企业历史性机遇也随之到来。英伟达CEO黄仁勋在《金融时报》AI未来峰会上下的判断——“中国将在AI竞赛中获胜”,正在各个领域得到验证。中国完善的电力能源基础设施、全球领先的新能源产业链优势,以及政府对科技创新的大力支持,共同构成了培育物理AI发展的沃土。

特别是在能源布局方面,中国已建成全球最大的清洁能源体系,为物理AI所需的海量算力提供了绿色、低成本的电力保障。这种基础设施优势,使得中国企业在训练大模型和部署物理AI应用时具有显著的性价比优势。

小鹏的发展历程,正是中国科技企业厚积薄发的缩影。从智能电动汽车到物理AI,从地面出行到低空领域,小鹏展现出了完整的全栈技术自研能力和前瞻的产品布局眼光。这种能力的构建,既源于企业自身的创新基因,也得益于中国完善的制造业产业链和丰富的人才储备。

物理AI的竞争刚刚开始,但趋势已经清晰。以小鹏为代表的中国科技企业,正凭借全栈自研的技术实力、清晰的产品路径和对全球市场的深刻理解,在这场关乎未来的科技竞争中稳步走向舞台中央。当AI真正开始理解和改变物理世界时,中国企业这一次不再是旁观者,而是重要的参与者和引领者。