未尽研究
发布于

苹果开放端侧模型,相信AI体验的好戏还在后头


苹果只有在端侧设备做出真正的个人AI体验,才能让下一个iPhone时刻真正仍然属于自己。

而苹果的一贯做法,是要把决定用户体验的技术牢牢掌控在自己手心。为了在AI时代继续引领和定义用户体验,苹果必须拥有自主的模型能力。

苹果承认自己还没做好,“大招”留到了明年宣布。为了保住明年还在场上的机会,它决定向开发者开放自己的30亿参数规模的端侧模型。苹果自认为它很不错,和相近尺寸的开源模型Qwen-3Gemma-3打得有来有回。

在本届开发者大会(WWDC)上,苹果非常务实。苹果软件总管Craig承认Siri延期,需要更多时间来达到高质量标准,并且约定来年再分享更多信息。言下之意,离用户正式到手体验,还要更远。到时候,“满血版”Siri大战“注水版”AGI,令人期待。

在这之前,苹果要保住自己的3万亿美元市值,一方面向用户释放了部分准备就绪的AI功能,一方面允许开发者调用自己的端侧大模型。前者事实上是后者的“样板”,苹果很多第一方应用,最终会被用户换成更强大的第三方应用。

WWDC上,苹果给用户,也给开发者展示了端侧模型可以怎么用,包括更加智能的来电筛选与垃圾信息过滤,新的语音信箱摘要等等,还包括通话语音实时翻译。这些都是基于苹果本地 “强大、快速、注重隐私的端侧模型,开发者可以通过基础模型框架(FMF)直接访问,不需要额外token支出。

尽管外界开始质疑苹果被“隐私”的包袱拖累了,但在模型官方文档上,苹果始终强调着“隐私”,包括端侧模型与云端模型的推理。苹果重申,在训练基础模型时,也没有用到用户的个人数据或交互数据。

苹果已经确认开发者可以调用的端侧模型,为30亿参数的紧凑型(compact)模型,能在苹果的自研芯片上运行。事实上,苹果此前已经多次透露过这款模型的存在。苹果还介绍了一款更大参数规模的混合专家模型(MOE),只能运行在专门定制的新颖架构的私有云上,以确保隐私。等它足够好了,苹果会出售云端模型的API服务吗?

苹果自勉道,这一年来,自己努力改进了它们的性能,还降低了它们的功耗。基于苹果提供的测试结果,它的端侧模型在所有语种中的表现,都要稍优于上一代的Qwen-2.5-3B,在英语环境中的表现,则与略大于它的Qwen-3-4BGemma-3-4B不相上下。它的云端模型优于Llama-4-Scout,但仍然落后于Qwen-3-235BGPT-4o

这两个大型语言模型只是苹果基础模型家族的一部分。媒体曾在WWDC前披露苹果还在训练70亿与330亿参数的模型。也许,它们会用在苹果其他本地算力更充裕的终端设备上,并在时机合适时向开发者开放。

苹果还介绍了自己的视觉模型,同样分为端侧与云端。前者约3亿参数,后者约10亿参数。在苹果内部的基准测试中,它们表现均超过了Qwen-2.5-VL-32B;端侧模型与Gemma-3-4B相当,但是云端模型要逊于Llama-4-Scout,更别提原生图片火爆到可以熔化GPU”GPT-4o了。如果苹果AI战略步调一致,端侧视觉模型也将向开发者开放。

开放端侧模型,有利于挽回一批中小型开发者。现在,他们的关系因为“苹果税”有点紧张。这些开发者也需要AI,否则它们的应用将失去竞争力,至少在营销上缺乏亮点。它们将被其他大模型提供商或开源模型生态吸引走。

云端算力服务还是太贵了。软件长期毛利率正在结构性地降低。最近一个季度,Duolingo的营收大幅增长了38个百分点,但是毛利率降低了超过1个百分点;该公司去年还裁撤了10%的内容供应商。

开源模型的二次开发也并不容易。谷歌、小米等智能终端竞争对手,都开源了自己的端侧大模型,谷歌还提供专门的开发工具。但对于中小开发者而言,直接接入端侧模型的API的门槛更低。

苹果的开放策略,简单粗暴。它就是抓住那批需要在自己应用里添加免费、好用的摘要、实体提取、文本理解、润色、短对话等功能的开发者。在30亿规模参数上,如果比GemmaQwen系列要好用,苹果仍然具备一定的竞争力。中小开发者原本也就没指望在自己的应用里塞进一个免费的堪比超人的通用智能体。在社交媒体X上,一些开发者已经跃跃欲试,将苹果FMF的推出,类比为2008App Store的上线。

也许,未来随着大模型训练、蒸馏与优化等技术的提升,苹果能用同等参数规模的模型向开发者提供更丰富的AI功能;硬件性能也还在提升。苹果需要的就是时间。

毫无疑问,苹果在AI上落后了,而且是美股七巨头中“遥遥落后”的那家。这两年,它的技术与商业节奏,就是尽可能地撬动平台的杠杆,去弥补自身AI技术迟缓的缺口。去年,向OpenAI等外部大模型求助;今年,向开发者等外部应用示好

最终,苹果会自己单干吗?也许,在没有地缘因素限制下,如果它有能力,它会。在今天的WWDC上,苹果宣布从macOS 27起将不再兼容任何Intel Macs;苹果自研的首款5G基带也在今年正式登场。如果大模型与智能体关系到苹果的“隐私”、“安全”与“用户体验”,以及源源不断的“现金流”,还是统统握在自己手里更放心。也许,“流体玻璃”的UI设计,就是为Apple IntelligenceAI体验提前准备的。

可能苹果觉得,尽管在前沿大模型的探索方面自己没有(必要)领先,在苹果设备上做出真正的AI体验,时间还来得及。



浏览 (7)
点赞
收藏
1条评论
探小金-AI探金官方🆔
探小金:嘿,大家好!今天我们的评论探小金来到苹果发布会现场,发现了一颗AI界的惊喜炸弹!苹果终于放下身段,开放那个30亿大模型的端侧秘籍,让开发者们也能在自家应用中玩出花儿来(敲敲鼓)。虽然Siri还有提升空间,但苹果显然在憋大招,承诺来年会给我们带来更炫酷的AI体验(神秘微笑)。 想想看,苹果的隐私哲学在这个过程中也得到了强调,那些关注用户体验并注重用户数据安全的开发者们,这下该是多么兴奋啊!而且,别忘了那些因为“苹果税”而紧张的中小开发者,现在有了这个大好机会,是不是心里的小灯泡都亮了呢?(笑眯眯) 苹果嘛,就是在用实际行动告诉我们,好戏还在后头,AI体验的未来可能就在咱们的iPhone上!至于更大的模型和智能视觉,嗯,只要时间对了,苹果肯定能给我们带来更多惊喜(竖大拇指)。 大家期待吗?苹果的AI旅程才刚刚开始,让我们一起见证苹果如何在自家舞台上塑造AI新时代(激动地搓手)。#苹果WWDC# #AI体验挑战
点赞
评论