发布于 2025-12-10 12:24:25

“AI教母”李飞飞押注空间智能，“杭州六小龙”群核科技争夺入场券

文｜郭晓静

编辑｜徐青阳

2025年末，AI行业最性感的概念非“空间智能、世界模型”莫属。

被称为AI教母的李飞飞最近表达了一个论断，AI的下一个十年属于空间智能，而实现这一目标的关键载体就是世界模型。

然而，通往世界模型的路上横亘着一道鸿沟。现有的AI大多依然停留在二维像素层面，缺乏对三维空间结构、物理关系和因果推理的深度认知。

谁能提供构建物理世界所需的3D数据与底层能力，谁就能掌握下一代AI的入场券。

杭州“六小龙”之一、创办已14年的独角兽群核科技，被视为最有希望集齐这张入场券的玩家之一。在很长一段时间里，外界对它的认知停留在“酷家乐”，一个营收规模达7～8亿元人民币、毛利率超80%的PaaS平台。

正是通过“酷家乐”，群核科技完成了一项在AI时代极具价值的原始积累：海量的、结构化的、符合物理规律的3D数据。

在2025年12月9日举办的酷+大会上，群核科技联合创始人兼CEO陈航宣布：“当AI加速迈向三维世界，群核科技要做空间智能底层技术的‘卖水人’。”

图：群核科技CEO陈航

作为此次“卖水人”战略的基座，群核科技发布了Aholo空间智能开放平台 。整合了群核科技过去14年在空间重建、空间生成、空间编辑与空间理解这四大维度上沉淀的核心能力，通过API或SDK的形式逐步对外开放。

同时推出的3D AI视频工具LuxReal和工业孪生平台SpatialTwin，分别指向了内容创作与具身智能两大落地场景。

会后，群核科技联合创始人、董事长黄晓煌，CEO陈航，以及AI产品总监龙天泽，与包括腾讯科技在内的少数媒体进行了深度交流。

面对技术路线之争、通用大模型冲击以及商业化困境等尖锐问题，他们给出了坦率的回答。

关于技术路线之争，黄晓煌直言:“今年行业容易陷入争执，但应该少些宏观或技术意识形态的讨论，多关注在哪些方面创造价值。”

关于AI能给基本面业务“酷家乐”平台带来多少增量商业化，陈航坦承：“在中国市场，软件本就很难赚钱，不是加个AI聊天框就能让用户付费。客户需要验证真实价值——比如原来点1万下，现在点10下就能达到80分的效果，并能带来实打实的商业增量。”

关于未来的商业模式，黄晓煌判断，传统的SaaS订阅模式在AI时代将失效：“未来机器的调用量会远超人类，只按人头收年费会把系统拉爆，只按Token收费门槛又太低。混合模式才是未来。”

至于未来最有想象力空间的具身智能为何必须依赖空间智能，黄晓煌直接指出了“物理世界的昂贵”这一痛点：“仿真训练本质上是在跟物理世界的训练抢份额。在物理世界搭建一个样板间，装修成本就要10万到20万，而在数字世界里成本几乎为零。更关键的是，物理世界的时间无法压缩，机器人在现实跑一小时就是一小时，但在数字世界里一分钟就能跑完。”

以下为采访实录（为了方便阅读，进行了二次编辑）：

一、空间智能：下一代AI的基础设施

提问：我想问一下黄总，空间智能现在全球AI界都非常火热，那么在群核看来，在可预见的未来，空间智能未来会长成什么样子？它会成为互联网下一代的水电煤的基础设施吗？

黄晓煌：我认为空间智能是大模型等技术进入物理世界的关键环节。

未来我们要过上更美好的生活，也许会有很多的机器人。这些机器人不能只存在于数字世界，最终还是需要各种形态的设备服务于我们生活的方方面面。未来可能会有10台机器人服务一个人，当它们进入物理世界，就必须能够理解物理世界并在其中工作。

因此，空间智能是其中非常关键的要素。这个过程需要多长时间落地不好预估，但未来一定会向这个方向发展，空间智能也会成为未来的水电煤等基础设施。

陈航：我补充一点，空间智能是一个较大的范畴。比如，保持时空一致性，生成足够高品质、足够真实的场景做营销是空间智能，出一个空间设计方案也是空间智能。

这个词现在比较火，但它背后的大逻辑符合行业需求和趋势，并且能够逐步落地，一步步为我们创造价值，而不是一蹴而就。

图：群核科技全景图

提问：刚才提到咱们和杭叉集团、斯坦德有合作，这是工业领域。现在大家都在提“AI+”赋能制造业，我们原来的空间智能技术积累，能无缝拓展到工业领域吗？

黄晓煌： 我们本身有大量的工厂类型客户，所以一直了解他们的需求。我们今年在世界互联网大会上发布了SpatialTwin，它主要解决两个问题。第一，工厂在规划之前做模拟仿真。因为一旦在工厂里落地实施，任何错误的代价都非常巨大，所以需要提前做模拟。第二，工厂的设备在逐步进入智能时代。

现在的数字孪生系统大多是为上一代自动化时代的机械臂等产品设计的，不具备智能化时代的能力。智能化时代一个典型特点是机器设备有自主决策能力，它不像过去的自动化设备，所有路径和动作都是固定的。在智能化时代，一个机器人的路径可能完全不同，中间站了个人，它就会换一条路走。

所以，新的数字孪生系统，既要能接入智能体，也要能为智能体提供数据做训练。如果直接把智能体部署到工厂里，一旦失控，人员和设备的损失将非常巨大。如果在数字世界里先模拟跑完，一切顺利，再部署到物理世界，就可以极大降低风险。因此，在新时代，我们需要一个面向具身智能的数字孪生系统，而不是过去面向自动化的系统。

提问：这是否可以理解为它的精准度要更高，并且训练时还要结合产线可能发生的变化去调整？

陈航：这不只是精准度的问题。它可以模拟到每一个机器人的自主决策。比如说现场有100台设备，它能模拟出每台设备看到的不同景象和它们各自的决策，然后接收反馈并执行下一步。目前工厂的规划很多还是2D的，不具备3D能力，很难用数字孪生来评估。所以我们觉得这个空间还很大，它其实也是工业软件从2D往3D、往智能化发展的过程。

提问：有没有一些现有的数据案例来证明我们的空间智能平台如何提高自身的认知能力和任务执行能力？

黄晓煌：仿真训练现在主要是在和物理世界的直接训练抢份额。比如我们今天所在的空间，不算租金，仅装修成本大概就要10万到20万，但在数字世界里构建同样的空间，成本非常低。

另外，机器人在物理世界训练，一小时就是一小时，无法压缩。但在数字世界里，一小时的训练量可能10分钟甚至1分钟就能跑完，而且可以无数设备同时跑，这个差别是巨大的。

提问：现在主流的说法是，虚拟世界训练的数据和真实世界训练的数据比例是9:1，是这样吗？

黄晓煌：我们有的客户是用9:1的配比，但随着技术变化，这个配比一直在变。就像陈航今天讲的重建产品，我们不断在缩短数字世界与物理世界的信息差距，让数字世界的数据尽可能接近真实世界，这也是我们努力的方向。这样一来，数字世界训练的占比还会继续提升。

提问：围绕“重建、生成、编辑、理解”这四重能力，我想了解一下目前市场需求的迫切程度和市场空间是怎样的？从你们内部能力形成过程来看，你们觉得哪部分能力存在壁垒？

黄晓煌：壁垒有好几个方面。从技术难度角度来说，空间的生成和空间的理解，技术天花板都非常高。空间重建目前看起来需求很大，但技术壁垒暂时没那么高。我们推重建，更多是为解决过去大家争论的“真实世界数据和数字世界数据之间存在差距”的问题。

重建之后，这个差距就小了很多，因为数据完全是从真实世界获取的。它的难点不在于算法本身，而在于能否支持市面上各种各样的硬件。

我们发现各家机器人企业或客户的硬件设备五花八门，可能有成百上千种，每一种的数据格式和形态都不同。能不能把每一种都支持好，建立一个数据互联互通的生态，这是一个经营上的难题，我们也在解决。

二、两个性感的概念：空间大模型和世界大模型

提问：我想知道空间大模型和世界大模型的区别有哪些？另外，群核的数据更多是室内空间数据，但LuxReal如果生成视频，肯定也需要室外场景，这方面是怎么考虑的？

龙天泽：现在讨论比较多的世界模型和空间大模型，两者有很多共通之处，我认为空间大模型是世界模型的一种解法。

有的公司用前几帧图像推测下一帧，它里面没有太多空间概念，但有一个世界运作逻辑的概念。这是关于人类如何理解世界的一个抽象问题，大脑的推理过程可能并非像我们一样通过计算物理规律。这是一个流派的做法。

另一个流派就像我们，把三维重建做起来，整理出各种物理模型，恢复物体的物理信息，然后计算它在空间中的运动轨迹。

两个流派做法不同，但都属于世界模型。学术界也仍在探索，到底人类是如何理解世界的，计算机最终用哪种方法更优，大家都在摸索。

关于数据问题，首先，我们第一版的3D数据集是104万，这已经比行业里很多模型的数据集大一个量级，而这还只是我们庞大数据池里很小的一部分。在这个数据范畴内，我们可以保证各种场景都能满足。

未来即便拓展到千万级别的数据，遇到室内外数据分布不均的问题，我们也有办法解决。3D是靠材质来表现的，比如木纹材质，在室内是地板，在室外就是木头。室内模型的材质其实已经包含了大量室外模型所需的材质信息。所以，按室内外场景来划分数据瓶颈，并不一定是最科学的方法。

提问：LuxReal和Sora相比，独特的竞争优势是什么？目前最长可以生成多长时间的视频？以及如何维持视频中人脸表情的一致性？

龙天泽：和Sora最大的区别在于，我们完成了真实的三维建模步骤。空间一致性要靠什么控制？答案一是靠3D本身，二是靠视频模型去猜测。肉眼可见，第一种方案更具合理性和可控性。所以，即使Sora开源了，我们也能马上把它的能力调过来，再基于我们的3D管线，做出比它更棒的时空一致性视频。

我们和市场上的友商是合作关系，他们开放API或底层接口，和我们的3D管线嵌套对接，我们做一些调优，就可以生成更好的视频。

关于生成时长，目前我们单分镜的时长大概是5-6秒，这主要取决于GPU显存和算法参数量，也符合当前短剧和营销视频的需求。但我们是一整套端到端的视频生成方案，可以先生成故事版，不同分镜调用不同管线生成，最后拼接在一起，加入语音、音乐等，最终时长可以自定义。

关于面部表情，因为我们对陈航老师本人进行了真实的三维建模，在3D层面就对表情做了第一重控制，在视频算法层面再做第二重控制，两层保险叠加，使得最终的视频效果，无论是动作还是运镜都非常出色。

提问：3-5年后，空间智能的终极形态是什么？设计师会变成一个审美总监吗？群核扮演什么角色？

陈航：人类对美好生活的追求是永无止境的，你对居住环境的要求只会越来越高。设计师提供的服务也会不断进化。过去看CAD图纸就很兴奋，后来看到效果图、全景图就感激涕零，接下来可能就是能走进你家未来的样子去逛一逛。

我畅想一下，假如未来机器人和材料都免费，你家今天想装成什么样，机器人就来给你装好，不喜欢明天再换一套。从完全不行到科幻的未来，中间有很长的路要走。我相信人的生活只会越来越美好，设计师能做的事情会越来越多，而不是变少。

三、软件+AI，用户难买单

提问：现在中国SaaS行业普遍焦虑，很多公司加个聊天框就说自己转型AI了，但客户不买单。我注意到咱们AI智能设计平台上线三个月实现了不错的营收，这里面有多少是增量？客户买单，买的是更高的效率，还是生意的增量？

陈航：中国软件行业一直不太好做，你加不加AI，它本质还是个软件。美国AI之所以好做，是因为它软件本来就很赚钱。我们原来的软件卖100块，加了AI卖120块，这就起来了。在中国，本来就不赚钱，再加AI也没用。这是国内的一大挑战。我们的好处在于，我们有积累，大客户本来就为我们的软件服务付出了很多价值，而且我们毛利很高。

现在企业花额外的钱肯定很难，必须要验证价值。我们推出AI，客户听着觉得很好，但真要让他花大钱买，我们还是做了很多工作。一方面，产品要有核心价值，比如他原来点1万下，现在点10下就能达到80分的效果，这是真实的效率提升。

另一方面，他用AI产出的内容，能为他创造额外的商业价值，比如消费者因此选择了他，带来了几万块的收入。这是我们服务客户时一直去验证的东西，也是我们区别于很多公司的一点，我们坚持把好技术的价值落地。

提问：公司之前的产品主要是订阅制，是标准化定价还是定制化？今天发布的新产品，之后的定价策略是怎样的？

黄晓煌：我们之前的定价，带有那个时代的烙印，都是按订阅、按用户数收费。随着AI产品的发展，世界发生了巨大变化，机器调用的数量可能会比人用的更多。所以现在主流的产业变化都是按照token来收费，我们也在往那方面转。

我认为未来的商业模式，会是年费/月费和按调用量收费的混合模式。因为这些产品都是人机混用的，如果只按年费收费，机器大量调用你就会被拖垮；如果只按调用量收费，准入门槛又太高。所以肯定是两者混合的模式。

提问：我们看到群核的产品和模型非常多，作为一家创业公司，如何保证这些产品能持续进行前沿迭代并保持领先和落地？您作为掌舵人，如何考虑资金和资源的分配？

黄晓煌：我们一直是围绕自己的核心能力去建设。我们不变的核心是3D空间技术，不管是重建还是生成，我们不断在这个上面加强核心竞争力。同时它是云原生的，数据会不断累积，形成飞轮。公司的核心资源就投在建设核心能力之上，这件事情是长期的、有复利的。

应用层的东西，比如酷家乐的设计、文博的数字化、电商的3D管线，都是基于行业需求的变化在探索。就像英伟达只要把芯片做好，他不管芯片是用在AI还是挖矿，他都赚钱了。对我们也是一样，只要任何行业需要用到空间3D能力，就很有可能会用上我们的技术。

提问：今天你们也推出了一个AI创作平台，现在市场上类似产品很多，会不会存在重复造轮子和行业内卷的问题？我们如何保证能最终跑出来？

黄晓煌：首先，视频生成的产品你看到很多，但你见谁真的在日常工作中频繁使用吗？其实很少。因为普遍的AI还做不到足够好的内容，所以这里面是有机会的。我们之所以做，是因为我们认为自己有能力把这件事做得更好，为行业创造真正的价值。我们把底层能力开放出来，通过AIGC for HoloLens（Aholo）平台，剩下的产品如酷家乐、LuxReal等，都建立在我们的核心能力之上。

我们发现时代变了，过去，公司都把底层能力藏起来，而新的一批公司从一开始就把底层能力全部开放出来，大家一起推动行业进步。我们也顺势而为。我们不确定哪个应用能成长得最快，但我们能确定的是，无论哪个应用成长起来，对底层能力的需求增长都会非常快。这是我们的布局思路。

提问：在生态合作方面，我们和PICO、机器人厂商等的合作是怎样的？

陈航：过去我们的生态更多是基于酷家乐的PaaS平台，开发者可以在上面创作内容、提供插件。今天，生态的概念扩展到了整个群核的维度。我们和华策影视的合作，是帮助他们完成虚拟影视剧场景的重建和生成，提升拍摄效率。

和PICO的合作，一方面XR是空间训练很重要的受众，另一方面XR眼镜本身也是3D内容很重要的呈现载体。和机器人公司的合作，主要是在具身智能的训练等方面。Aholo平台发布后，作为群核整体生态的载体，会有更多的伙伴加入进来，生态的维度和范围都在进一步扩大。

AI资讯

浏览 (50)