MIT报告,露出了AI企业应用的残酷现实,和它想卖的药
在过去的五个交易日里,美国AI与算力概念,经历了一波小小的下挫,又很快收复失地。AI泡沫就像是“狼来了”的故事,MIT关于“95%企业对AI投资回报为0”的报道,同时在中国与美国刷屏。
MIT的报告,并没有太过新鲜的东西。大模型的价值传递,已经从芯片、数据与云基础设施,转移到了大模型提供商,但尚未真正渗透进亟待AI改善生产率的传统行业。这仍然是红杉万亿美元问题的翻版。AI大神卡帕西,也较早留意到了大模型技术很快成为个人能力的放大器,却在企业和政府层面,效益显得微弱。
AI很好,但还不够好;相比技术,传统企业架构与工作流程自身没准备好的问题更大。MIT的解决方案也并不新鲜。BVP等很多风投机构都开始支招,从现在到2026年,AI技术的提供者与采用者该怎么做。在中国,也有企业家在刚过去的WAIC上建议,从替换现在工作流程中的一环开始。
但是,恰恰是这份报告火了起来。它是市场与舆论对于“AI泡沫”担忧的重唱。尤其是最近,GPT-5成了哑弹,OpenAI谋划兜售算力,连奥特曼都开始渲染AI泡沫论——当然,他说的是别人。此前,人们就担心,万一GPT-5搞砸了,会引发金融危机吗。
看到MIT的报告,媒体们如获至宝,将其简化为“AI泡沫”,但又忽视了这份报告悄悄夹带了“私货”。
95%的企业失败了
MIT的这份报告,核心结论之一,就是企业很热衷尝试生成式 AI,甚至花钱部署了,但是绝大多数没跑出来,大约只有5%的项目,才称得上对财务数据有所贡献。
MIT的这个结论,主要来自今年上半年的调研与访谈。其中,包括52家企业参与的结构性访谈,以及153位高管在4场行业会议上反馈。报告在最后声明了样本与方法论的局限性。
但是,如果只是想炮制“AI泡沫论”,其实不用那么麻烦。这个世界上存在比它大的多的样本,而且真金白银得多。它就是美国的资本市场。尽管有通胀助推,自2022年以来,美国的“标准普尔490指数”基本没有显著增长;只有10家市值最大的公司——除了1.05万亿美元的伯克希尔,它们几乎都与AI有关——拉动着美国经济与美国股市继续繁荣。
美股市值正在迅速向这些巨头集中,与互联网泡沫破裂前夕如出一辙。忘了传统的市值加权“标普500”吧,如果将它们等权重处理,500只股票不论市值大小,一律占0.2%权重,那么,在ChatGPT发布后,这个新指数已经跌了很久,跌回了2003年前的水平。在2000年前,“等权标普500”也是大幅下跌的。
不同的是,2000年前,“标普10”在“标普500”中的占比约为25.8%,如今则已经达到了39.8%,为近25年来所未有。另一处不同是,当时“标普10”的Nortel Networks已经破产,英特尔与通用电气(GE)市值也不复当年。
乐观的投资者认为,这次不一样。因为这些硅谷巨头的每股收益实现了非常真实的增长。谨慎的投资者则认为,这些硅谷巨头不再“轻资产”,自由现金流也在萎缩。2026年,亚马逊、谷歌、微软和Meta在数据中心上将花费超过4000亿美元,而且还将越来越多;它们的资本开支占现金流的比重,即将赶上其他美国上市公司的总和。
也许有人是“长期主义者”,崇尚佩蕾丝关于“泡沫与黄金时代的动力学”的理论,相信泡沫正是新世界的起点,它需要经历一场大爆炸。
它们为什么失败
事实上,MIT对AI的真实态度,要比媒体报道的乐观得多。在报告中,95%企业的“失败”,部分是大模型技术问题,更多地则是企业自身的问题。
企业与员工正在争先恐后地拥抱AI。受访样本企业中,80%探索了试点,40%花钱部署了;超过90%的员工,经常以个人身份购买的AI产品,去完成企业交付的工作任务。而且,也不是所有的行业都“失败”了,科技与媒体等两个行业就做得很好,出现了深度的结构性转变。据该报告,衡量是否成功的标准,在于企业市场份额、营收增长、商业模式、用户行为与组织架构等变化。
但是,这些企业普遍追求部署成本低,以及能立即带来可见的价值的AI。这导致它们的投资预算,50%都流向了前台的市场与营销部门。因为,它们的KPI相对容易考核。这也很好理解。无论是美国的上市公司,还是中国的上市公司,尤其是那些以广告和商务为主要收入的公司,为了向投资者证明,如今自己确实已经成为一家AI驱动的公司,也都往往介绍AI如何改变了广告业务,包括用户时长和留存率,以及广告的点击率和转化率等。谷歌、Meta,以及腾讯与快手等,都是如此。
但是,真正能够大幅削减成本,或创造价值的后台部门,在引入AI后,负责人可以向董事会汇报的指标,都与直接的财务指标,隔了厚厚的一层。更麻烦的是,引入定制化的AI,对部门来说,暂时还会增加运营成本。
它会忘记上下文, 无法学习,也不能进化。即使它能进化,也不是基于业务闭环的“在工作中学习”,而是依赖于大模型提供商的历次迭代。别忘了,提供商的迭代,与客户想要的迭代,可以相距多远。不少用户就不喜欢GPT-5,想要GPT-4o回来。
企业的反馈相当务实,每个企图进入企业AI市场的创业者都该听听。为了面对竞争局势,企业的产品与服务时刻都在变化,业务流程也因此几乎随时都在变化,大模型与AI的部署与调整需要足够的灵活性;人类员工可以持续进步,它也不能老是重复犯同一个错误;它需要与公司的真实业务数据相对接,但又不能与客户数据混在一起,否则会导致数据隐私问题或污染问题;它需要适配企业现有的工具,而不是让企业花钱一下子全部换掉;它的提供商需要从头学习客户身处的行业,不能只懂AI不懂业务;它的提供商最好是客户现有的合作伙伴,而不是随时可能倒闭的初创企业。
MIT的这些观察,并没有超出当前的行业认知。我们在WAIC上就听到中国企业家提醒,从业者不能高估短期收益,也不能低估长期积累。AI人才需与专业人才深度融合,先构建稳定业务闭环,再通过AI实现升级与重塑,最终让人机协同成为智能时代的基础运营范式。BVP等美国风投机构,也开始针对AI在企业中的实际应用,提出全新的评估要求,既要基于专有数据和私有用例,又要持续地嵌入生产系统和反馈循环,围绕业务的真实指标(准确率、延迟、幻觉率、客户满意度等)展开,在受监管行业中,还要具备可追踪性和可解释性。
再不采用智能体就晚了
MIT在报告中“制造焦虑”,卖点不是“AI泡沫”,而是“智能体转型窗口”稍纵即逝。该报告认为,“95%企业失败”其实有解,而且已经很紧迫了。它开出的药方,其实就是智能体。最后,它又开始兜售自己的智能体协议。
这份报告的出台,有两个背景要素。第一,这份报告的真正撰写团队,是MIT NANDA(网络化的智能体与去中心化的人工智能)团队。第二,这项调研始于2025年初,终于2025年6月。但是,同样是这份报告,也承认从试点到部署,大型企业往往需要9个月甚至更长,就连表现最佳的那些企业,平均也需要3个月。这意味着,这份报告所调研的,其实是去年上半年的大模型是否取得了财务上的“成功”。这离智能体尚未真正兴起尚有一段距离。
进入2025年,智能体才呈现爆发之势。去年底,Anthropic推出Computer Use;今年初,ChatGPT推出Operator,并于7月整合到ChatGPT智能体;谷歌的Project Astra正式集成到Gemini Live也要等到今年。Deep Research几乎成为所有前沿大模型的标配智能体功能,甚至出现了一个人创业公司的可能。在非关键流程或相邻流程中嵌入定制化工具,已经展示出了明确的价值。
AI巨头对AGI的叙事已经转变,它们正在为产品与服务构建基础设施。相比GPT-4,GPT-5的提升主要处于软件工程与智能体等领域,以及大幅减少幻觉等。从GPT-2到GPT5,AI能处理的任务时长(指人类完成相同的任务的时长)越来越长。如今GPT-5-Thinking的中位时间可以达到2小时15分钟,已经可以在狭窄的工作流程中取得小而明显的胜利,然后再随着智能体的改进而逐步扩大。OpenAI也因此有望在年底实现200亿美元年化收入(ARR),而Anthropic有望达到90亿美元。
很多媒体误会了MIT所制造的焦虑,忽略了报告中的这句话:“跨越通用人工智能鸿沟的窗口正在迅速关闭”。越来越多的工具与智能体正在被创建出来。支持这些工具与智能体的基础设施,正在通过诸如模型上下文协议(MCP)、代理对代理(A2A)等逐步形成。这些框架能够实现代理之间的互操作性,并优化对工具与智能体的评估与调度。
至此,MIT穷途匕见。它将NANDA协议悄悄地放在了与MCP和A2A同等重要的位置。NANDA是MIT开发的智能体协议,类似于为AI智能体建立组织架构,更侧重于赋予它们身份、角色和职责,引入了加密身份验证与分布式账本等技术,以期建立“可信、可治理、可交易”的基础设施。站在行业的发展方向看,MIT在报告中夹带的“私货”,仍然颇具现实意义。即使不是MIT的NANDA成为标准,这个层面的协议也一定会出现。
不过,由于存在自证其逻辑的“嫌疑”,这势必削弱这份报告部分结论的效力。比如,MIT的报告坚定地站在了外部采购AI服务要优于垂直自研的这一边——这仍然是一个行业持续争论的话题——尽管它也承认,在所有受访者中,后者的数量差不多是前者的两倍。