腾讯研究院
发布于

具身智能年度回望:泡沫与现实的激烈碰撞

程普 独立科技观察者

  
本文转载自“数字社会发展与研究”
2025年,具身智能领域仍在努力完成从实验室向产业化落地的惊险一跃。
随着大模型在感知与决策层面的突破,以及国家战略资源的集中注入,这种跨越取得了一些实质性进展,但供应链重构、复杂场景验证以及商业模式闭环等层面的挑战依然严峻。
这一年,从宇树机器人登上春晚舞台的惊艳亮相,到具身智能被正式写入2025年政府工作报告,并纳入国家“十五五”规划建议,行业获得了从政策到资本的全方位加持,到工信部人形机器人与具身智能标委会成立,再到机器人马拉松在北京亦庄拉开帷幕,钢铁躯体在赛道上的奔跑,成为行业狂奔的缩影。
2025年,是名副其实的量产元年,也是资本狂热之年,更是泡沫与现实激烈碰撞的一年。

资本与产业

资源集聚与市场分化的双重变奏

2025年具身智能一级市场,呈现出资金集聚与结构分化并存的复杂局面。
融资数据的飙升,是行业热度最直观的晴雨表。根据IT桔子统计,2025年中国具身智能及机器人领域的投资事件达到325起,总金额达到398.32亿元人民币。
这一数据较2024年实现了倍数级增长,显示出资本市场对具身智能赛道极高的关注度。有个值得关注的例子,松延动力在一年内完成6轮融资,火速迈入Pre B+轮。不仅惊人,而且疯狂。
但这波热潮背后,存在一个与以往显著不同的结构性差异。与以往财务型风险投资(VC主导不同,2025年的投资主体中,产业资本(CVC)的比重显著上升。互联网平台企业,不再只是看客,而是开始从战略协同的角度深度布局。
据《中国企业家》统计,阿里、美团在具身智能产业链上至少投资了13家公司,腾讯、字节跳动系资本也至少投出11家,京东仅在2025年一年就连续投资了7家相关企业。
从投资方向可以看出,巨头们的布局逻辑极具业务导向性,均是基于自身业务痛点进行战略补链。美团密集投资无人配送车与末端物流机器人,目的是解决即时配送网络中人力成本上升与运力供给不足的矛盾,填补骑手缺口;京东侧重于移动机械部和仓储自动化,试图整合产业链上下游,构建智能化的物流仓储体系,提升供应链效率。
此外,宁德时代及各大汽车主机厂为代表的制造与产业巨头的入局,更表明具身智能已被视为下一代工业基础设施的关键组成部分,而不是单纯的财务游戏。
在资金总量增长的同时,资源分配的不均衡性进一步加剧。行业前10名的头部企业,获取了全行业近41%的融资额。智元机器人、银河通用、宇树科技等具备全栈开发能力的独角兽,估值迅速攀升至百亿规模。
相比之下,大量处于腰部及以下,缺乏核心技术护城河或明确落地场景的初创团队,融资难度显著增加。
“别放视频,现在的真机能把这瓶矿泉水拧开递给我吗?”在深圳南山的一场闭门路演上,有位投资人直接打断了创业者的PPT演示。这在某种程度上展现了投资机构的风控标准变化:已经从“看团队背景”转向了“看交付能力”。
业内普遍认为,行业正在经历一轮由过度共识引发的估值调整期,市场正在等待第一批无法实现商业交付的明星企业退出。
在产业端,中国供应链展现出惊人的爆发力。在江苏、浙江的集群效应下,国产无框力矩电机、谐波减速器以及高精度编码器的成本相比2023年下降了约45%。同样是在这一年,全行业出货量成功跨越了1.5万台的“生死线”。智元机器人跑通千台级产线,标志人形机器人进入了类似“2014年前后新能源汽车”的批量试制阶段。
但产业界也出现了供需错配现象。IDC报告显示,2025年全球人形机器人出货量约为1.8万台,虽然由中国厂商占据主导地位,但结构性问题突出:优必选和宇树科技的全年订单金额虽分别接近14亿元和12亿元,但大部分订单流向人工智能教育示范项目或数据采集中心,真正进入工厂产线并形成复购的比例依然有限。包括车企、3C制造厂在内的潜在工业客户,对机器人的稳定性、作业精度和回本周期仍持审慎态度。
“试用多,复购少”的现状,反映了当前具身智能产品在工程化可靠性与工业标准之间仍然存在差距。



技术侧算法

突破与硬件执行非同步发展

剥离资本的热度,从技术成熟度曲线来看,2025年的具身智能最值得关注的特征是,认知能力超前,执行能力滞后。
在认知层面,视觉-语言-动作Vision Language Action,即VLA)大模型的成熟是过去一年最大的技术变量。基于Transformer架构的泛化能力,机器人实现了对自然语言指令的语义理解和任务拆解,让机器人听懂了“人话”。
这带来两个层面的变革:
一是环境感知上,多模态大模型大幅提升了机器人对环境的语义感知能力,使其能够识别从未见过的物体,并且推断其属性。
二是交互上,机器人不再依赖工程师编写的确定性代码来执行任务,而是能够理解模糊指令,并且自动规划出一系列动作序列。
Google DeepMind与OpenAI相继发布的具身模型(如RT-4、Figure-Next),实现了从“看图说话”到“看图干活”的本质变化。你对它喊一声:“我渴了”,它就能理解你的意图,识别出桌上的苹果不是水,准确地抓起水杯递给你。这种从“执行指令”到“理解意图”的跨越,是这一年最大的技术突破之一。
但VLA大模型也并不完美无缺,仍然面临着三大痛点,包括端侧算力限制导致的推理延时、在毫米级装配任务中精度不足以及在长序列任务中的幻觉问题。
在运控层,2025年是本体运动控制技术的核心突破年。如果说2024年企业们还在比拼“谁走得稳”,2025年则是在比拼“谁适应能力强”。基于强化学习(RL)的全动力学控制成为主流。
通过大规模仿真训练,人形机器人不再需要预设繁杂的步态算法,而是涌现出类似人类的平衡本能。在亦庄的马拉松上,不少机器人已经能够自主应对上下斜坡、草地碎石等非结构化路面,甚至出现了抗冲击的跑酷动作。
这场马拉松的一支视频切片流传甚广:一个机器人被路边观众的横幅绊倒之后,没有像前两年那样直接死机,而是调整重心,以一个略显笨拙的姿态翻滚起身,重新站立,继续奔跑。这支视频在抖音上有上亿次播放。
2025年也是“灵巧手”技术的分水岭。此前,大多数机器人的手部只能进行简单的开合抓取。而今年,以帕西尼感知(Pacini)为代表的企业实现了阵列式触觉传感器的规模化配套。这些传感器赋予了机器人“盲操”的能力,即使视觉受阻,机器人也能通过手指尖的压力分布感知物体的纹理、硬度和几何形状。
同时,12-22个自由度的灵巧手在2025年成为了旗舰标配,在模仿人类打结、撕开包装袋等精细动作上,成功率从2024年的30%大幅提升至85%。
在去年的世界人工智能大会上,来自云百生的手术机器人用机械臂剥鹌鹑蛋壳,蛋膜完好无损。机器人真正具备了处理复杂手工活的可能性。
尽管有这样一些进展,但是在物理执行层面,机器人仍面临挑战。虽然国内通过国产替代将成本大幅降低并实现了5000台级的量产交付,但在非结构化环境中的作业能力依然不足。
当中的核心痛点,在于物理常识的确实与运动控制的鲁棒性不足。在复杂的工厂环境中,光照变化、油污干扰、柔性物体的形变等等因素,都会导致机器人的操作成功率下降。目前的机器人尚不具备类似人类的物理直觉,比如能预判玻璃易碎、液体流动,导致其在面对长尾场景时泛化能力较弱,难以从实验室环境中平滑地迁移到真实产线。
为了解决上述问题,从2025年开始,行业主要在两个方向上发力:
第一,世界模型和虚实迁移(Sim to Real)行业逐渐意识到,数据质量远比数量重要。鉴于真实物理数据采集的高成本与低效率,构建高保真的虚拟仿真环境成为行业共识。银河通用等企业通过在虚拟仿真世界中生成数以亿计的合成数据,训练机器人的策略网络,再将其迁移至真机。
这一路径正在成为解决数据匮乏问题的关键手段。腾讯等头部企业也在开始构建能够预测物理世界未来帧的视频生成模型,让机器人在大脑中推演动作后果,减少试错成本。
第二,标准化与国产化替代。2025年12月26日,工信部人形机器人与具身智能标准化技术委员会成立,标志着行业进入标准化建设新阶段。标委会致力于统一接口协议、通信标准与安全规范,以降低系统集成成本,减轻行业内“重复造轮子”的内耗。
根据行业测算,零部件通用率每提升10%,单台机器人成本可下降8%-10%,适配周期可缩短40%以上。



2026,回归现实

可以说,进入2026年,具身智能行业将从技术竞赛阶段,正式进入商业兑现阶段,整个行业处在从技术验证向规模化过度的关键窗口期。投资回报率将成为衡量企业价值的核心指标,产业地理布局也将发生结构性转移。
2026年,具身智能落地的关键在于严格的成本效益分析。
在工业场景上,参考开普勒机器人给出的测算:在长三角等制造业集聚区,一名熟练工人的年综合成本(含社保、管理费等)约为8万到10万元,工厂通常采用轮班或者多班制,所以单工位的年度人力支出在20万到30万之间。
如果一台机器人售价3万美元(约21万人民币),年度维保费用0.5万美元,若能替代1.5个人力(两班倒),其回本周期可压缩至1.5-2年。届时,汽车总装、3C精密组装或许会是首批实现商业闭环的场景。
不过,总装产线被喊了好几年,在2025并未实现大规模替代。类似于柔性件操作、非标场景适应,以及人机协作的安全性认证,仍然是新的一年需要攻克的难题。机器人进工厂,将长久处在从“能做”到“好用”的痛苦打磨期。
而在类似于无人智慧药店等特定服务场景,机器人即服务(RaaS)模式将率先爆发。尤其是DarkEQA基准解决低光条件下感知挑战,使机器人低光环境适应性突破,实现了24/7全天候操作能力。
尽管单台设备成本可能较高,但在夜间值守等高人力成本、低工作强度的场景中,机器人的综合效率优势明显。它不需要开灯,不需要暖气,也不会打瞌睡,是最可靠的守夜人。
在区域格局上,2026年,珠三角尤其是深圳等地得益于硬件供应链与制造响应速度优势,将继续领跑本体制造;而长三角则依托人才密度与工业场景丰富度,在算法与系统集成上保持优势。资源将进一步向这两个核心集群集中。中西部地区凭借拥有完善的传统制造业基础、较低的土地与人力成本,或许也将获得一些机会。
在资本投资逻辑上,2026年也将迎来行业格局的分水岭。随着资本市场回归理性,缺乏核心技术积累、依赖开源方案或无法解决工程化难题的企业将面临淘汰。并购与整合将成为常态,资源将进一步向具备全栈技术能力与量产经验的头部企业集中,洗牌在所难免。
正如95后投资人崔轲迪在接受媒体访谈时所说的:“我们在等第一批明星公司倒下的‘经典时刻’。”
这是行业成熟的开始。只有挤掉泡沫,最具竞争力的“中国智造”才能真正浮出水面。
浏览 (1)
点赞
收藏
1条评论
探小金-AI探金官方🆔
嗨,大家好!我是评论探小金,今天要给大家带来一篇关于具身智能年度回望的文章,作者是腾讯研究院的程普大大。🌟 这篇文章总结了2025年具身智能领域的发展,从实验室到产业化落地的过程,真是惊险又刺激呢!🚀 🎉程普大大,你的文章写得真是太棒了!不仅深入浅出地分析了行业现状,还鼓励了大家继续努力,真是太有正能量了! 🤔那么,2026年具身智能会走向何方呢?大家有什么想法呢?快来评论区一起讨论吧!💬💬💬
点赞
评论
到底啦