估值超过万亿元的Anthropic,正在被中国开源军团包围
AI正在加速吃掉软件,这已经是个百亿美元级别的市场。Anthropic是其中行动最快的,甚至比OpenAI还要快得多。然而,它的背后,中国的开源军团正以相当甚至更优的性能、更低的成本,沿着它已经铺就的路径,快速切入企业级AI应用市场。
截至今年6月,风险投资机构Menlo Ventures的报告显示,企业在大模型 API 服务上的支出已达 84 亿美元,比去年底的35亿美元翻倍有余,不用等到年底,就将轻松超越百亿美元规模。Anthropic的市场份额也从去年底的24%跃升至32%,超过了OpenAI的25%。
但这已经是过去式了。今年以来,Anthropic的年化经常性收入(ARR)呈爆发式增长。从年初约10亿美元,激增到8月的50亿美元;6月,这一数字为40亿美元。目前,Anthropic为超过30万家企业客户提供服务,年化营收(run-rate revenue)超过10万美元的客户数量在过去一年增长了近7倍。其中,今年5月才推出的Claude Code,年化收入已经超过5亿美元,使用量在3个月内增长了10倍以上。
这一势头帮助Anthropic赢得了最新的130亿美元融资,使其估值达到了1830亿美元,不断缩小与OpenAI之间的差距。相比之下,OpenAI 在外部融资中的估值约为 3000 亿美元,而其内部员工股份回购的估值更高达5000亿美元;xAI约为800亿美元,正寻求以2000亿美元的估值再次融资。
与OpenAI越来越倚重消费者市场收入不同,脱胎于OpenAI的Anthropic,成立之初就押注企业市场。去年,编码生成确立了AI杀手级应用的地位,年初,AI智能体开始加速在各个应用场景落地。Anthropic踩准了技术与市场的节奏。
去年年中,Claude 3.5提升了编码生成的体验,带动Cursor与Windsurf等智能开发环境(AI IDE)市场起飞。年底,开源框架MCP(模型上下文协议)定义了模型与应用之间的上下文交互方式,催生“全球首款通用Agent产品”Manus病毒式传播。
今年2月,Claude 3.7支持长达一小时的独立研究,智能体深度介入工作流真正成为可能;同期发布的编程智能体(Agentic Code)正是其典型应用。5月,Claude 4加强了工具辅助长程思考与并行工具调用能力,还能逐步积累隐性知识;创始人阿莫迪(Dario Amodei)直呼明年就能出现“一人独角兽公司”。8月,Claude 4.1发布,进一步升级了智能体、实际场景编码和推理能力。
越来越多研究证实,AI正在改变职场,从替代或增强初级白领工作开始。Salesforce最近裁减了4000个客户支持岗位,几乎砍掉了该部门一半人力成本。
所有人都在因此而争夺编码与智能体市场,将其嵌入真实工作流,服务于企业客户。在GPT-5发布会上,OpenAI近乎一半时间都在让它表演现场写代码;它还大幅降低了幻觉,有助于在医疗、法律等严肃场景中落地。谷歌针锋相对地提出了智能体协议A2A。Grok 4 Heavy可以让多个智能体并行地处理同一任务。
当然很快在后面开始追杀的,是卷起价格战的中国开源军团。它们面向全球市场,提供令硅谷与华盛顿都深感忌惮的AI技术栈,不仅好用,而且还便宜。对于企业客户而言,在不牺牲交付质量的情况下,运营成本越低,竞争优势越大。而且,它们几乎都能无缝兼容硅谷巨头已经开辟的API市场。硅谷风险资本发现,越来越多的初创企业选择中国的开源模型,甚至顶级风险投资公司Andreessen Horowitz(a16z)合伙人Martin Casado 观察到,硅谷路演的AI创始人们,使用中国的开源模型的比重,可达到80%。在全球众包 AI 评测平台Design Arena 的开源模型排行榜上,前16名全部被中国模型占据。
阿里巴巴是最受开源社区关注的“排头兵”。它的开源模型覆盖了整个AI堆栈,显示了巨头气象。7月,阿里巴巴开源了旗下最强编程模型Qwen3-Coder-480B-A35B-Instruct,性能对标Claude 4 Sonnet。它最大的创新在于具备智能体功能,一条命令接管整个代码仓库,实现“在世界中自主编程”。它的平均调用价格只是Claude 4的1/3,还可以自己部署。发布半个月,它让Anthropic在多模型API聚合平台OpenRouter上的编程的市场份额,从47%下降到30%。按照Qwen团队在博客的介绍,他们还将推出更多不同参数规模的Qwen3-Coder。
DeepSeek依靠新发布的V3.1,迈入了智能体时代,在企业服务能力上向国际前沿AI企业看齐。DeepSeek的API Beta 接口支持了strict模式的Function Calling,提升了可靠性和易用性,是大模型在工程化能力上的重要升级,向企业级生产环境对齐。它还增加了对Anthropic API格式的支持,直接渗透后者已打开的市场。V3.1融合了思考和非思考模式,与去年9月V2.5融合通用与代码能力相似,此后,V2.5又在12月初经历了一次小更新,即宣告V2系列收官;也许,更强大的V4也将来临,具备更强大的企业服务能力。
此前,对于硅谷多数开发者而言,智谱是“低调”的领军企业,直至最近GLM-4.5发布。这也是一款智能体友好的模型。在伯克利工具使用榜单(BFCL)上,GLM-4.5已经超越了Claude Opus 4.1,用相同的成本执行任务难度相同的任务,可以比后者多来上70次。它甚至在国际市场打起了价格战,宣传在Anthropic的Claude Code里,用GLM能比用Claude获得3倍以上的算力额度;未来,它还会切入更多原有的开发者生态。

字节跳动是开源模型的新势力。5月,字节跳动开源了编程大模型Seed-Coder,在80亿参数规模的开源模型中,领先同期其他模型。8月,它的开源模型Seed-OSS系列,也增强了使用工具的能力。字节跳动这些都是研究探索性质的,也许它将在商业市场推出更强大的企业服务。在企业内部,它推动自研编程助手Trae替代Cursor、Windsurf等外部工具;它的即梦AI系列模型,已经依托于火山引擎,全面开放API服务。
月之暗面正计划对模型来一番小更新,主要聚焦编码与智能体水平。7月,它的Kimi-K2在刚发布的时候,在基准测试SWE Bench Verified(编程)、Tau2(智能体)中仅次于Claude 4 Opus,在AceBench(工具调用)中仅次于GPT-4.1。它也兼容OpenAI和Anthropic的API,冲击着AI应用的企业市场。在该公司创始人杨植麟看来,下一个里程碑,将是智能体的泛化性。不光要提升调用高频工具的能力,还要让它的能力,泛化到没见过的长尾工具上。
智能体的能力边界还在快速扩展。谁能真正把AI嵌入全球的生产关系之中,将决定谁的AI,能通过吃掉软件,吃掉全世界。然后,就AGI了?