苹果开放端侧模型,相信AI体验的好戏还在后头
苹果只有在端侧设备做出真正的个人AI体验,才能让下一个iPhone时刻真正仍然属于自己。
而苹果的一贯做法,是要把决定用户体验的技术牢牢掌控在自己手心。为了在AI时代继续引领和定义用户体验,苹果必须拥有自主的模型能力。
苹果承认自己还没做好,“大招”留到了明年宣布。为了保住明年还在场上的机会,它决定向开发者开放自己的30亿参数规模的端侧模型。苹果自认为它很不错,和相近尺寸的开源模型Qwen-3与Gemma-3打得有来有回。
在本届开发者大会(WWDC)上,苹果非常“务实”。苹果软件总管Craig承认Siri延期,“需要更多时间来达到高质量标准”,并且约定来年再“分享更多信息”。言下之意,离用户正式到手体验,还要更远。到时候,“满血版”Siri大战“注水版”AGI,令人期待。
在这之前,苹果要保住自己的3万亿美元市值,一方面向用户释放了部分准备就绪的AI功能,一方面允许开发者调用自己的端侧大模型。前者事实上是后者的“样板”,苹果很多第一方应用,最终会被用户换成更强大的第三方应用。
在WWDC上,苹果给用户,也给开发者展示了端侧模型可以怎么用,包括更加智能的来电筛选与垃圾信息过滤,新的语音信箱摘要等等,还包括通话语音实时翻译。这些都是基于苹果本地 “强大、快速、注重隐私”的端侧模型,开发者可以通过基础模型框架(FMF)直接访问,不需要额外token支出。
尽管外界开始质疑苹果被“隐私”的包袱拖累了,但在模型官方文档上,苹果始终强调着“隐私”,包括端侧模型与云端模型的推理。苹果重申,在训练基础模型时,也没有用到用户的个人数据或交互数据。
苹果已经确认开发者可以调用的端侧模型,为30亿参数的紧凑型(compact)模型,能在苹果的自研芯片上运行。事实上,苹果此前已经多次透露过这款模型的存在。苹果还介绍了一款更大参数规模的混合专家模型(MOE),只能运行在专门定制的“新颖架构”的私有云上,以确保隐私。等它足够好了,苹果会出售云端模型的API服务吗?
苹果自勉道,这一年来,自己努力改进了它们的性能,还降低了它们的功耗。基于苹果提供的测试结果,它的端侧模型在所有语种中的表现,都要稍优于上一代的Qwen-2.5-3B,在英语环境中的表现,则与略大于它的Qwen-3-4B与Gemma-3-4B不相上下。它的云端模型优于Llama-4-Scout,但仍然落后于Qwen-3-235B与GPT-4o。
这两个大型语言模型只是苹果基础模型家族的一部分。媒体曾在WWDC前披露苹果还在训练70亿与330亿参数的模型。也许,它们会用在苹果其他本地算力更充裕的终端设备上,并在时机合适时向开发者开放。
苹果还介绍了自己的视觉模型,同样分为端侧与云端。前者约3亿参数,后者约10亿参数。在苹果内部的基准测试中,它们表现均超过了Qwen-2.5-VL-32B;端侧模型与Gemma-3-4B相当,但是云端模型要逊于Llama-4-Scout,更别提原生图片火爆到可以“熔化GPU”的GPT-4o了。如果苹果AI战略步调一致,端侧视觉模型也将向开发者开放。
开放端侧模型,有利于挽回一批中小型开发者。现在,他们的关系因为“苹果税”有点紧张。这些开发者也需要AI,否则它们的应用将失去竞争力,至少在营销上缺乏亮点。它们将被其他大模型提供商或开源模型生态吸引走。
云端算力服务还是太贵了。软件长期毛利率正在结构性地降低。最近一个季度,Duolingo的营收大幅增长了38个百分点,但是毛利率降低了超过1个百分点;该公司去年还裁撤了10%的内容供应商。
开源模型的二次开发也并不容易。谷歌、小米等智能终端竞争对手,都开源了自己的端侧大模型,谷歌还提供专门的开发工具。但对于中小开发者而言,直接接入端侧模型的API的门槛更低。
苹果的开放策略,简单粗暴。它就是抓住那批需要在自己应用里添加免费、好用的“摘要、实体提取、文本理解、润色、短对话”等功能的开发者。在30亿规模参数上,如果比Gemma和Qwen系列要好用,苹果仍然具备一定的竞争力。中小开发者原本也就没指望在自己的应用里塞进一个免费的堪比超人的通用智能体。在社交媒体X上,一些开发者已经跃跃欲试,将苹果FMF的推出,类比为2008年App Store的上线。
也许,未来随着大模型训练、蒸馏与优化等技术的提升,苹果能用同等参数规模的模型向开发者提供更丰富的AI功能;硬件性能也还在提升。苹果需要的就是时间。
毫无疑问,苹果在AI上落后了,而且是美股七巨头中“遥遥落后”的那家。这两年,它的技术与商业节奏,就是尽可能地撬动平台的杠杆,去弥补自身AI技术迟缓的缺口。去年,向OpenAI等外部大模型“求助”;今年,向开发者等外部应用“示好”。
最终,苹果会自己单干吗?也许,在没有地缘因素限制下,如果它有能力,它会。在今天的WWDC上,苹果宣布从macOS 27起将不再兼容任何Intel Macs;苹果自研的首款5G基带也在今年正式登场。如果大模型与智能体关系到苹果的“隐私”、“安全”与“用户体验”,以及源源不断的“现金流”,还是统统握在自己手里更放心。也许,“流体玻璃”的UI设计,就是为Apple Intelligence的AI体验提前准备的。
可能苹果觉得,尽管在前沿大模型的探索方面自己没有(必要)领先,在苹果设备上做出真正的AI体验,时间还来得及。