旷视众神归位之原力觉醒?

邮箱|guohaiwei@pingwest.com
2月10日是原力灵机成立的第330天。
在过去一年的时间里,这家公司在很长一段时间保持了相对低调的传播风格。人们大多知道这是一家“旷视”团队含量很高的公司,也承接了一些旷视机器人方面的人才,正在从事进行具身领域的研发,发了些工具和一个Benchmark,后者还差点惹了些争议。
它的办公地点选在金隅智造工场。如果从工场的北门进去,会先看到一个庞大的旷视Logo,再穿过一排排各式各样的高新技术公司,便能在一个还没有贴上任何Logo的单元入口里找到它——
像极了这家公司的来时路。
原力灵机CEO唐文斌说,2月10日的原力灵机Openday是公司成立以来“第一次站在公开的镜头下”。这位曾经的旷视联合创始人、CTO,对舞台和媒体还是同样熟悉。无论是采访还是演讲,他说话语速快、咬字准,在工程师里拥有一流的口才,字里行间保持着对复杂技术名词的谨慎,有种“想要让所有人弄懂意思”的刻在教师基因里的自觉。
在OpenDay上,他将原力灵机的使命解释为三点:
打造智能的、有用的、可信赖的机器人。
今天在具身智能领域,人们已经越来越少听到一家机器人公司把自己的使命定义成“机器人”了。大家更习惯将自己称作“具身智能”或者至少“具身本体”的公司。相比之下,“具身”给人的印象更像是实现他们使命的“路径”——原力灵机将整个OpenDay的名字定名为“具身原生Embodied Native”。
而这只是这家公司在一众友商中,“独特气质”的一个非常微不足道的侧面。某种程度上,这种表达可能也是一种“旷视式”的审美惯性。
在千里科技的首秀发布会上,印奇也曾反复提及“机器人”。
他说“AI+车”的终局就是“机器人”,并提出了“One Brain,One OS,One Agent ”为核心愿景的“千里计划”——即构建一个由大模型驱动的AI大脑(One Brain);打造统一操作系统(One OS),整合每个人跨不同设备的记忆、行为与控制;最终通过高度懂你的超级智能助手(One Agent),实现无缝的跨终端、跨场景服务。
千里智驾背后模型基座,是其与阶跃共同研发的。而后者自1月26日以后,开始与前者共享了同一个董事长(印奇)。
在OpenDay上,原力灵机官宣的DM0基座模型,也同样选择了与阶跃联合训练的方案。而与阶跃合作,同样意味着原力灵机也成为了目前为数不多有能力“从头训练”具身大脑、构建底层基模的创业公司之一。

而无论是印奇履新阶跃,还是唐文斌公开原力灵机的技术探索成果与思考,都意味着曾经的“旷视三剑客”都已经跳出来一些原来本不必要的束缚,正式走向了更宽广的新智能战场。
1
“具身原生”
原力灵机的通稿里引用了唐文斌的一句话:“2026 年不是具身智能的元年,而是具身原生的元年。”
目前大量的具身大脑,无论是VLA还是一些所谓的世界模型,其实是在传统transformer架构模型上加入了类似action的模块,来获得机器人的控制能力。
类似嫁接的方式,唐文斌说,这就像是一个九年义务教育毕业的初中生,被拉到体校去狂体育。
这里会面对两个问题:
首先,因为从小没有练体育,所以骨头不强壮,上限是有限的;
其次,练三年,发现文化课被落下了,落后了,“训着训着发现它的通用能力有大幅降低”。
唐文斌认为,要解决这个问题的方式就是“具身原生”——即不仅仅是机器人上运行的大模型,而是一个从智能本质和形成机制上都根植于物理交互的这样一个新的AI模式。
在演讲中,唐文斌将这句话翻译成了三个板块:
数据原生、训练原生、框架原生。

印奇、唐文斌、杨沐是过去旷视的三剑客。而在唐文斌手下,原力灵机也形成了自己的“新三剑客”。按照这次演讲的顺序分别是:
合伙人周而进,主讲DM0——首个具身原生大模型,以2.4B的小参数量模型登顶了Robochallenge;
合伙人汪天才,主讲Dexbotic2.0——开源具身原生框架,与Rlinf合作,目标是打造具身世界的Pytorch。
联合创始人范浩强,主讲DFOL(Distributed Field Online Learning)——具身原生应用量产工作流,希望通过强化学习等方式,来降低机器进入真实场景的门槛,力图实现26年的具身应用“涌现”
而以上三个产品,则是此次OpenDay上三个最重要的“具身原生”的成果发布。某种程度上,也都在不同程度上回应了唐文斌对“具身原生”的许多解释。

比如,唐文斌说,所谓“数据原生”的背后是要加入真实世界的全要素数据、包括触觉数据在内的多模态数据等。
周而进则表示,原生数据采集范式其实就是寻找“高熵”的过程,它的本质是对抗“不确定性”——“熵在哪里,数据就投向哪里”。
因此,智能是“熵减”的过程,而数据则是“熵减”的燃料。
周而进对硅星人表示,DM0这次的预训练数据结构中,互联网数据、导航工厂、具身采集数据三者会保持大致相对的平衡。

而在训练侧,唐文斌不断强调的关键词是“真实世界”——即模型要与真实世界互动,奖励函数也来自“真实世界”。
唐文斌认为,在过去理解世界、预测世界、影响世界,三者原本应该是统一的,应该“被放在一起去训练”。
周而进这次介绍的一个训练方法叫做“构建空间推理思维链”。
这跟过去LLM的思维链CoT有点相似,都是将问题有序拆解,但空间推理涉及的维度明显更多,涉及到模型与物理世界的直接交互。

至于具身原生框架方面,唐文斌寄予了非常高的期待。
他对硅星人表示,具身开源框架未来可能可以扮演某种类似于操作系统的角色,从而大幅降低其他参与者的开发门槛、提高开发效率。
而如果要在所有的开源生态中,必须选一个他认为当下最重要的组件,唐文斌对硅星人表示,他会选择以Dexbotic2.0为代表的开源框架。

汪天才在演讲中,将Dexbotic2.0总结了几个特性:
第一项是“模块化架构”,而这是整个框架能成为开源基础设施的重要前提条件之一。
汪天才表示,当下主流VLA,无论是RT-2,还是Pi0,他们本质都是模块化的架构。尤其是通过Dexbotic2.0的,人们就会发现在具身智能中的两大关键任务,包括具身的操作和导航,实际本质都是一样的架构。
在Dexbotic2.0的框架下,开发者可以将具身智能系统拆成三块可自由组合的“乐高模块”,V(Vision encoder)、L(LLM)、A(Action Expert)模都可以独立升级、替换和混搭,便于快速试验新模型,并适配不同硬件和任务场景。

其次,汪天才认为真实世界的数据都是多源的,而不同的数据的功能以及背后的要求不同。所以在Dexbotic2.0里建立对应的多源数据混合训练的能力。
此外,Dexbotic2.0还可以帮助开发者做数据处理,包括把仿真数据也都转化为统一的Dexdata格式,从而让模型训练和测评都可以更加公平。而在硬件侧,Dexbotic也新增支持了包括星海图在内的一些新的硬件本体。
最后,而在模仿学习和强化学习方面,Dexbotic2.0直接和Rlinf达成了合作,目标是对标大模型时代的SFT+RLHF的黄金范式,打造属于具身智能的Pytorch。

1
具身进入开源基建时代?
可能乍一看,原力灵机又是一家“做所有事情”的公司。他们做自己的框架、数采方案、从0开始训基座模型、benchmark,未来不排除还会做一些本体的探索;他们既要做智能上限的AGI,还要为场景能力去寻找针对性解决方案,做今天就能很落地的产业动作。
但原力灵机也有着很独特的标签气质:
首先,他们几乎把所有能开源的东西都开源了。
比如对于RoboChallenge,唐文斌在采访中承认“这不是一个完美的”测评方案。他说,团队内部甚至一度在争论,到底要不要作为RoboChallenge的发起方,还要把DM0上传到Robochallenge上,“讨论很激烈”。
唐文斌说,这次原力灵机对开源的要求“非常彻底”,“要保证大家下载了我们的code、DM0、Dexbotic,直接去RoboChallenge提交就能拿到现在的分”。
其次,这家公司对于“真机”、“真实世界”有一种近乎偏执的追求。
唐文斌把“具身原生”的定义是从智能本质和形成机制上都根植于物理交互的这样一个新的AI模式。

RoboChallenge最早是原力灵机的内部测评项目。众所周知,Benchmark的本质是对能力的抽象,没有什么能比一家公司认同的Benchmark,更能代表他们的技术审美了。而RoboChallenge是行业里第一个大规模的真机考场。
唐文斌说,原力灵机今年的目标是:
能实现一个场景,一千台,可持续运转。
其中最核心的重点是“可持续”,因为这才意味着行业走通了一个场景的规模化闭环。

所以这里你能看到至少两个“循环”:
一个是智能底座、开源生态与智能上限的循环,通过给生态更多的工具,来支持的整个具身生态的发展;
一个是现有的智能水平与场景落地的循环,研发像DFOL这样的工具、与Rinf这样的合作伙伴联合, 来实现具身的场景落地。
而这两件事情都不是一蹴而就的,甚至可以说直到今天,如果和远大的未来相比,行业其实也只是刚刚开始。
所以唐文斌说,今天行业非常重要的就是基础设施——
因为基础设施决定了迭代的效率。任何公司做的新算法,大家都能学会,但迭代的效率是根本。所以AI公司真正核心的竞争力,唐文斌说,他认为就是基础设施。
“我们内部把整个基础设施从自底向上分成几个层”,唐文斌说,从数据,到训练和推理的基础设施,再到模型的基础设施,最后到硬件、评测、应用,一系列基础设施决定了原力灵机何能够更快速去迭代具身原生的能力。

2月10日是原力灵机的第330天,离2026年结束也差不多是接近330天。
或许到明年这个时候,我们会更加清楚这是一家什么样定位的公司。
在Openday上,唐文斌和阶跃CEO姜大昕有一个隔空对话——
唐文斌说,他心目中的GPT时刻是,“玩具”变成了“工具”,能具备生产力了。但他也不止是期待一个ChatGPT时刻,同样也期待一个DeepSeek时刻。因为DeepSeek时刻可能意味着产品能走进千家万户,从to B走向to C。
姜大昕在回答2026年度期待的时候调侃唐文斌,说2026年他期待完成一个具身的GPT时刻。但如果唐文斌觉得这样(竟然)都还不够挑战的话,“那就上半年实现ChatGPT时刻,下半年实现DeepSeek时刻”。
但我想,无论是阶跃+千里“软硬一体”的商业闭环构想,还是原力灵机这次想要构建的真实场景与智能的联动。用AI与商业撬动更庞大的世界,可能才是这几位旷视“毕业”的创业者真正想做的事情。