小米对标的,其实应该是谷歌
苹果画下的端侧个人AI体验的大饼,谷歌就要率先实现了。现在,谷歌是最懂AI手机的巨头。它最新发布的Pixel 10系列,是用户马上就能用上的AI手机。
谷歌的Made by Google发布会,事实上宣告这家科技巨头实现了自研芯片Tensor G5与Gemini及安卓在端侧的闭环。发布会后,谷歌CEO皮查伊还在X上预告,秋季将有更多新品推出。留给苹果的时间,真的不多了。
但谷歌想展示的,不仅仅是谷歌制造,而是继互联网中心之后的,下一个AI智能体中心,包括AI的软件和硬件。在AI和互联网技术栈,它拥有TPU芯片、云、大模型Gemini,操作系统和数量最多的杀手级应用。在AI端侧硬件,从手机到自动驾驶汽车,从智能眼镜到智能家居,谷歌仍在用AI和软件重新定义和发明这些产品。
春风得意的小米,已经从一家手机制造商,扩展至汽车、芯片、AI、眼镜等领域,它的第二增长曲线已经确定,第三增长曲线已经出现轮廓,它要从范围经济向网络和智能经济攀升。
小米和字节等,真正对标的,应该是谷歌。
Gemini+Tensor G5
谷歌大模型Gemini正在变得无处不在。虽说这是一场硬件发布会,四款谷歌Pixel 10系列手机亮相,手表和耳机同步更新,但谷歌还是将足足一半时间留给了它的大模型Gemini。
在手机上,Gemini正在变得更为主动。拍照仍然是很多用户的核心场景,如今,个人摄影教练Camera Coach可以一步步指引用户拍出好照片,照片后期美化也变得像聊天一样简单。Gemini Live比今年谷歌I/O大会上展示的更智能,现在不仅可以看到用户所看到的,还可以直接在屏幕上突出显示解决方案来提供指导;它还会感知用户语气中的情绪,自主调整适应。
更主动的Gemini,本质上是一个离用户最近的智能体,实现跨应用程序的上下文理解,自动将谷歌应用生态串联在一起。
在Pixel 10系列手机上,谷歌旗下AI的杀手级应用研究助手NotebookLM,已与截图和录音集成,一旦感知到照片或文字内容合适,就会自动建议添加到笔记本中。智能信息提示Magic Cue,可以自动从Gmail、日历、信息等原生应用中,适时自动提供建议或操作;所有交互都在一个界面完成,不再需要反复切换操作。这正是苹果Siri最想做到的。

苹果的优势正在一步步丢失。谷歌已经推出了自研手机AI芯片Tensor G5,直接全系列适配,不像苹果,每次只在旗舰款搭载最新芯片。Tensor G5由台积电代工,3纳米工艺,相比上一代,它的CPU性能提升36%,TPU速度提升了60%。尽管业内判断它实际性能仍然不如高通与苹果,但它不仅做到了软硬件一体化,而且与AI一体化了。
谷歌在博客上列出了这款芯片改变旗下Pixel系列手机格局的五大理由,其中最重要的是,它成为首款能够本地运行最新Gemini Nano模型的芯片。在发布会介绍的相当多的AI功能,可以完全基于本地算力实现;部分功能仍需借助混合AI。
谷歌的AI正在向更多硬件形态渗透。智能手表主打健康,谷歌为此加入了由Gemini驱动的个人健康教练服务。智能耳机也集成了 Gemini智能语音助手。苹果不是正打算发力桌面机器人与智能家居吗?谷歌提前截胡,发布了Gemini for Home。
小模型是智能体可预见未来
小型模型正在成为端侧AI的标配。谷歌对端侧模型布局已久,但在前沿模型竞争日趋激烈的阶段,端侧AI体验战略始终处于“边缘”状态。这一次,交付端侧AI体验的时机成熟了。
2023年底,落后于OpeAI的谷歌奋起直追,搬出了Gemini 1.0,就包括专为“设备上的任务”设计的Gemini Nano。它刚一推出,就被集成到Pixel 8 Pro智能手机中。2024年年初,Gemini Nano被集成到三星Galaxy S24智能手机中。年中,谷歌还将其集成到Chrome桌面端。但此后,Gemini历次更新,Nano都不再是发布会的重点。
不过,谷歌加速开源了“小杯装”Gemma系列模型。在Gemini初代发布不久,2024年初,谷歌就开源了2B和7B两个不同大小参数规模的Gemma模型。到了最新的Gemma 3,先是更新了1B、4B、12B等“世界上最好的单芯片模型”,最近更是将其规模参数压缩至270M,低功耗,25次对话消耗Pixel 9 Pro的0.75%电量。
似乎,谷歌通过Gemma将其他安卓生态的硬件、应用笼络到谷歌旗下,让开发者们练练手,然后通过调用Gemini Nano的专用API,支持谷歌嫡系的Pixel系列手机的应用生态,并延展至谷歌更多终端产品上。这些设备又成为其他安卓生态品牌的基准。
这一次,谷歌终于公开了Gemini Nano部分信息。基于Tensor G5,最新的Gemini Nano可以处理32K的上下文窗口,相当于100张截图或1个月的Gmail。以这种类比方式介绍Gemini Nano,事实上是将跨应用调度的智能体能力,视为了为其核心能力。到2025年下半年,包括OpenAI的GPT-5,以及DeepSeek的V 3.1,越来越多AI厂商,直接将智能体功能直接融入大模型,已经没有人会怀疑智能体就是AI的未来。
英伟达更进一步,认为小模型才是智能体的未来。因为智能体的任务,往往是重复的、可预测的,与其让成本高昂的通用大模型处理这些范围相对明确的任务,不如让一个个经过微调的小型模型去执行每个子任务——这样就能和丰富多样的端侧设备结合起来。
更小的模型,推理都在本地,免去了云服务费用;参数利用率越高,对硬件的需求越低,也能降低AI硬件的购买门槛;本地推理还意味着不需要承担可能的“隐私”泄露的成本。而且,小型模型可以在较小的数据量与资源条件下高效微调,迭代更快,可以快速适配不同的需求。
目前,Pixel系列手机的销量,在全球占比不到 1%。在这个意义上,谷歌Gemini Nano通过Pixel系列在端侧的验证,或许将反过来影响未来整个大模型与智能体的研发与创新。
小米对标谷歌
谷歌一直被称为互联网的中心,现在,它想做AI智能体网络的中心。但它还得等等硬件就绪。国内厂商也不会错过将硬件、模型与生态整合到一起的机会,甚至会有更多的新产品。最有希望对标谷歌的AI智能体网络中心地位的,是今年新晋全球市值100强的小米集团。
谷歌是目前拥有最完整的AI技术栈的科技巨头。它自研了总拥有成本低于英伟达芯片的TPU,在此基础上构建AI基础设施,训练出最强大的旗舰模型Gemini与开源模型Gemma。它是智能眼镜的发明者,也最早开启自动驾驶商业运营;拥有自己的智能手机、手表与耳机,以及智能家居Nest,并通过操作系统与大模型辐射至其他安卓设备。谷歌已经将Gemini接入旗下七个拥有超过20亿用户的产品和平台。
小米正在开启自己的垂直整合,要补的课还有很多。与谷歌相比,它缺乏训练下一代大模型的芯片与AI基础设施。小米可以称得上已经拥有操作系统、大模型与端侧芯片,但是,它们至多属于入门阶段。作为硬件公司,小米也缺乏自己的超级应用。不过,它的手机、汽车与智能家居,产品线要比谷歌丰富得多,比谷歌更懂制造和供应链,正在占领全球市场;小米也拿出了自己的AI眼镜。但真正的竞争,将在AI时代重新开始,这对小米而言是挑战也是机遇。
目前,小米的全球智能手机出货量排名前三,市场份额14.7%,和前两名的距离(三星、苹果)再次拉近。如果三星深入嫁接谷歌Gemini Nano,对小米的海外市场开拓,将是艰难的挑战。在刚过去的财报会议上,小米集团总裁卢伟冰表示,小米手机坚定瞄准“年出货量2亿台俱乐部”,并且坚持高端化战略,已经实现了玄戒自研,正在推动底层模型的突破。小米汽车计划在2027年出海。
“有自研芯片的公司,和没有自研芯片的公司,未来将是代际的差距”,小米已经砸了135亿元人民币研发玄戒,雷军计划至少投资十年,至少投资500亿。此外,小米透露,今年全年研发费用将约为300亿元左右,其中的25%会投入到AI上。
在财报电话会议上,小米提出要从“范围经济”公司,升级为“网络经济”公司。“人车家”生态,无一不需要向用户交付更好的个人AI体验,很大程度就取决于跨硬件与跨应用的智能体能力。小米需要迅速升级迭代AI智能体,将其推送至手机、汽车与智能家居上。
更多的中国手机厂商都在入场。OPPO选择了阶跃星辰,荣耀选择了智谱。甚至媒体传言,字节跳动也正在研发 AI 手机,由中兴ODM代工,暂定名“豆包手机”。它一听就是搭载了“豆包大模型”的。
如果说小模型就是智能体的未来,最起码是可预见的未来,那么,字节跳动肯定不愿意错过一切可以验证小模型智能体表现的硬件载体。在这个意义上,它不再仅仅是新的交互界面,还象征着新的智能上限的可能。它可以是VR设备PICO、智能耳机Ola Friend等等,当然也可以是手机。别忘了,锤子手机就是被字节跳动收购的。与小米相比,字节跳动更接近谷歌的地方在于,它的AI基础设施遍及全球,大模型能力要明显强于小米,也拥有自己的超级应用。
正在降临的AI智能体“网络经济”,会是小米与字节跳动不断在全球市场挑战谷歌吗?