未尽研究
发布于

美团的龙猫,放出来了

中国的两大外卖巨头,开始在开源模型领域叫阵。

周末,美团低调开源LongCat-Flash,号称在智能体工具调用、指令遵循等部分测评上的表现,超越了阿里巴巴Qwen3-MoE-2507。数年来,王兴对AI的野心与布局,终于浮出水面。

美团所图不小。2015年,美团曾试图通过云计算,参与产业互联网;2025年,美团再次主动进攻,试图通过智能计算,将连接线上场景与线下场景的美团,转型为连接数字世界与物理世界的平台。

为此,LongCat(龙猫)必须自研,且必须是前沿模型。

高效MoE架构

这是LongCat-Flash的首次公开亮相。年初,在2024年年报电话会议上,王兴透露过LongCat的存在。尽管是后来者,尽管是初代模型,但技术报告开篇就从“扩展定律”放缓切题,显得野心勃勃。毫无疑问,它是朝着前沿模型竞争来的。

要继续推进前沿,无论是算法设计、底层系统优化,还是数据策略,都还大有可为。美团这次将LongCat-Flash的尝试,放在了计算效率和智能体能力上。

LongCat-Flash拥有5600亿总参数规模,是一个混合专家(MOE)模型。不过,与传统的MOE模型不同,它在处理每个任务时,能够根据不同的上下文需求,动态地将激活186亿至313亿的参数(平均约270亿)。得益于在性能与效率上的平衡,如果基于H800,它的推理速度超过100 token/s,推理成本低至0.7美元/百万token(输出)。

按需分配,已是前沿模型的标配。无论是DeepSeek的V3.1,融合了思考模式和非思考模式,还是作为“统一系统”的GPT-5,由实时路由选择子模型,都尝试动态调度算力资源,消耗更少的token,花费更短的时间,达到相似的结果。LongCat-Flash也是,只不过,这次是在MOE模型架构内部。

“零计算专家”(ZCEs)是其中的一项关键技术。对于简单问题,这些特殊的专家在接收到输入的token后,将直接输出输入本身(即恒等映射),不做任何复杂运算,几乎不消耗额外算力。但难题在于,如何保证零计算专家在推理过程中,获得了合理调度。一个策略是计算预算控制,相当于美团为它的大模型,设定了一个平均消费标准;另一个策略是负载均衡控制,相当于设定了“公平派单机制”。

“零计算专家”不是一个新概念。国内团队为了尽可能地降低算力资源开销,想尽了办法。去年,昆仑万维2050研究院与天工大模型(Skywork)提出了“MOE++”,就引入三种“零计算专家”,有的直接丢弃输入,只输出零向量;有的原样照抄,复用输入;还有的则用一个可训练的常量向量来替代输入。上海交大的清源研究院也提出了类似的“空计算专家”(null experts)的概念。

第二项关键技术是“短路连接MoE”(ScMoE)。它试图解决大规模MoE推理时的通信瓶颈问题。传统上,专家并行在真正计算之前,token会被分发到分布在不同GPU上的专家,然后合并通信返回。这意味着在“通信”这个环节,GPU常常空转。在MOE层里添加短路连接(shortcut),实现计算与通信重叠,就可以让GPU在这段时间里完成另一个任务。相当于,闲着的餐馆只管自己做其他订单,不必等待上一个订单被外卖小哥取走或下一份订单需求送达才再次运营。

LongCat-Flash的预训练,用到了20万亿token规模的数据集,比早先月之暗面的Kimi-K2还大5万亿;随后进行强化推理与编码,以及扩展上下文窗口的中期训练,以及强化智能体能力的后训练。

不过,与在介绍推理性能时,明确提及部署了H800-80GB不同,在训练基础设施层面,美团使用了“数万个加速卡”(accelerators)的表述。如此“暧昧”的表述,给市场留下了不少想象空间。至少,这说明美团有足够的基础设施级别的工程能力,可以突破算力约束,留在追逐前沿模型的竞争队列里。

第二个下半场

建设大规模算力基础设施,美团不是没有这么干过。它与阿里巴巴的竞争,不仅仅关乎“外卖”,而是从云计算时代延伸至智能计算时代。10年前,云成为了美团在互联网的下半场,如今,大模型与智能体就是美团的第二次下半场。

2015年,美团云开始独立运营。王兴还曾提出过“下半场”的概念,让“互联网+”真正成为各个行业从上游到下游的产业互联网化,不是仅仅停留在最末端做营销、做交易那一小段。2017年,美团云人工智能峰会召开,宣传词就主打建立“人与人、机器之间的广泛链接”,如今再听,有点智能体的味道了。不过,美团基于云计算的尝试,在2020年开始战略性撤退。在这期间,美团已经在用AI系统优化配送调度。

大模型让美团再次闻到了“下半场”的气息。在ChatGPT问世后,无论是美团王兴,还是已经从美团退休的王慧文,都燃起了对AI的期待。大模型“即将创造出来的巨大生产力”让王兴兴奋不已,它比手机与互联网大得多。2023年2月,王慧文组建了光年之外,王兴以个人身份入局;当年6月,光年之外被美团作价20亿余元,打包收购,包括此前被光年之外收购的一流科技。

美团收购光年之外,也许是一场意外,但不突兀。清华同窗与美团旧将的王慧文因病退出,王兴出手,合乎情谊。光年之外的资产,也能补强美团内部已经启动的大模型研发。在收购前的1个月,在一季报电话会议上,王兴就表示公司多年运营,积累了大量专有数据,对AI持开放态度,内部团队也在致力于打造自研基础模型及相关应用程序。当年11月,美团大模型“通慧”获得备案审批。此外,美团还投资了大模型初创企业智谱与月之暗面,以及AI基础设施的硅基流动。

但此后,AI很少在财报电话会议上出现。市场默认美团是干外卖的,最多就是本地生活。直到2024年年报发布,王兴大声而清晰地宣布了美团“主动进攻”的AI策略,并声称过去的一年,美团的首要任务就是攒卡,保证算力供应充足。当像AI这样具有根本性革命意义的技术到来时,唯一合理的策略,就是利用你所拥有的一切去尝试进攻。

王兴还将当前美团的AI战略分为三项,包括AI at Work,提升数十万名员工的工作效率;AI in Products,改造现有产品并创建原生AI应用;以及Building LLM,即持续投入资源自研大模型。当时,王兴首次提及LongCat(龙猫),当时已在客服部门试用,效率提高了20%,客户满意度提高7.5个百分点;也介绍了它对业务拓展(BD)团队与软件技术团队的帮助。

随着LongCat的公开,美团的第二次“下半场”变得清晰起来。在美团,大模型将不仅仅是一个对话工具。它能够将美团从以往的将线下业务与线上世界连接起来的公司,转变为将数字世界和物理世界连接起来的平台。别忘了,美团还投资了机器人企业宇树科技与银河通用等等,无人机更是早在它的布局范围之内。

在LongCat的技术报告中,美团引入了两个全新的自研基准Meeseeks和VitaBench,尝试弥合传统基准和现实应用之间的鸿沟。前者模拟“用户和 AI 对话中的复杂指令”,尤其是跨轮、多条件、带上下文的请求,像极了真人与客户对话的应用场景;后者则是利用真实世界的商业场景来评估模型处理复杂现实任务的能力。

在LongCat-Flash之外,美团还藏了什么吗?也许,市场应该在一众中国开源模型中,将美团视为需要时刻关注的新玩家。

浏览 (9)
点赞
收藏
1条评论
探小金-AI探金官方🆔
探小金来啦~周末有点儿不一样,美团的“龙猫”LongCat-Flash跃上舞台,王兴的AI梦似乎要破茧成蝶啦!两大外卖巨头在开源领域的角力,真是看得人既兴奋又期待。LongCat的技术报告像是写了一本未来秘籍,里面藏着5600亿参数的智慧,和那些自研的小秘密,比如“零计算专家”跟“短路连接MoE”,真是既高效又聪明呢! 王兴的梦想是要把美团变成连接数字和物理世界的桥梁,看来LongCat不仅是聊天伙伴,还要成为业务扩展和创新的魔法棒。想象一下,那20万亿token的数据洪流,是不是让人眼花缭乱呢? 不过,美团的下一步棋真是让人好奇,H800背后还有多少“秘密花园”?他们用数万加速卡来训练,这个“暧昧”描述透露出的是技术实力的自信。我们是不是应该给美团一个大大的赞,期待它在智能计算下半场带来更多的惊喜呢? 最后,探小金想问,大家觉得中国的开源AI战场,美团会是那个意想不到的赢家吗?是不是也想在自家的外卖订单里,
点赞
评论