黄仁勋台北宣布NVlink Fusion,以软件生态主动兼容国产芯片的想象
黄仁勋脱下了西装,又穿上了皮衣,从北京、华盛顿、中东之行,回到了他最熟悉和拿手的科技主场。
在台北的Computex大会上,黄仁勋一如继往变戏法式地推出一堆AI概念和产品。但如果五年后回望,宣布NVLink Fusion,也许是黄仁勋这场演讲对整个AI行业影响最为深远的一刻。用生态去叠加地缘,这里面可以有演变。
NVLink Fusion,向AI世界工厂开放
NVLink是英伟达自研高速互联技术,通过提升网络通信功能,将过去数据中心中一堆各自运转的GPU,变成一个统一的GPU。这正是英伟达之前5年的关键任务。与PCIe 5.0(128 GB/s)相比,它提供的带宽高出14倍。但它之前只服务于自己的AI生态。
黄仁勋正在将“AI工厂”视为下一个5年的关键。在这场产业变革中,每家“AI工厂”的任务各不相同,所需AI基础设施的最优配置,也可能略有不同。英伟达决定适度开放,允许客户“半定制”自己的“AI工厂”,选择将自己的CPU与英伟达的GPU一起使用,或将英伟达的GPU与其他定制AI芯片一起使用。甚至,定制AI芯片都不一定非得是用来加速transformer架构模型的。
NVLink Fusion为新玩家打开了AI生态系统,尤其是要在ASIC芯片市场中要占有一席之地。不过,英伟达可能也要冒着降低市场对其产品需求的风险。
对于正在抓紧研发自己的AI芯片的云服务商,以及联手支持竞争方案UAlink的英特尔与AMD而言,这是英伟达的一次主动出击。理论上,它可以让谷歌TPU、亚马逊Trainium、微软Maia和META的MTIA,无缝融入自己的“AI工厂”,包括CUDA生态以及更多软硬件技术栈。
对于中国而言,英伟达的NVLink Fusion生态,具备另一层想象力。到目前为止,美国对中国的芯片禁令,主要围绕GPU算力与HBM内存,并没有明文禁止NVLink通信性能。目前传闻中的英伟达为中国市场新款定制的合规芯片、以及传闻中的要在上海建一处研发中心,都和NVlink Fusion生态发生了某种关联的可能。
半开放的NVLink Fusion,其核心价值不仅仅是英伟达的GPU——谷歌的TPU的总拥有成本比它更低——更在于其围绕GPU构建起来的CUDA生态,以及目前正在打造的更广泛的软件技术栈。对于市场份额远低于英伟达的其他硬件厂商,尤其是中国芯片厂商来说,接入更为成熟的CUDA生态,是充满诱惑的“解药”,有效果,也有副作用。
联发科与Marvell等已经决定使用该技术构建定制AI芯片,富士通与高通已经计划使用该技术构建定制CPU。博通、英特尔和AMD目前都不在名单上,可能永远也不会。
从云到端,从硅谷到台北
这也是为什么,与去年的夜场不同,黄仁勋这次选择了早场,即使它对硅谷投资者并不友好。他有意无意地,绕开了硅谷的云服务商,特意捧了一下东道主的中国台湾。
AI已经不仅仅是技术趋势还是产业趋势,包括中国台湾在内的亚洲,世界工厂集聚密度最高,是“AI工厂”诞生的重要市场;它的很多供应链上下游企业也都在这里,需要就下一个5年的路线图,也就是“AI工厂”,达成共识。
英伟达的上一个“五年计划”,始于2019年收购Mellanox。通过重构网络通信,英伟达将整个数据中心,转换成一个计算单元,去完成同一个任务,预训练。现在,轮到工厂了。“AI 工厂,正在全球各地陆续上线”,它的价值将以“每小时产出多少 token”来衡量,也就是员工与智能体协作,围绕公司业务展开推理。
英伟达的“AI工厂”,首先以云端的大规模“集群”的形态实现,然后,被“黄氏定律”压缩到只需要一根电源线连接到家里墙上的插座即可。
AI工厂的部署权,逐步下沉至个人开发者。在今年CES发布的Spark(当时的Project Digits),是可以放进书包里的个人“AI工厂”,约1petaflops的算力性能,等效于2016年发布的上百公斤重的DGX1。在Spark遭遇苹果Mac Studio阻击后,今天,黄仁勋又更新了产品线,拿出了可以运行1T规模参数的DGX Station,20petaflop算力和800GB内存,仅一台就相当于6年前18000个Volta架构GPU构建的集群。
企业与工厂,得到了RTX Pro算力平台。黄仁勋实在太喜欢横空出世的DeepSeek了,再次将R1模型的表现放到性价比(兼顾单位时间token吞吐能耗与单用户推理速度)最优函数上,每花费500万美元,RTX PRO的性价比是H100的四倍。黄仁勋说,自己的所有合作伙伴,正在规模量产RTX Pro。这不禁让人回想起今年年初以来,中国突然爆发的“一体机”市场。
在黄仁勋的“AI工厂”的叙事里,还有新面孔“IQ”(Intelligent Query),是专为AI 优化的非结构化语义数据平台,让“AI工厂”更懂自己企业,让GPU的推理更有效地产出token;以及Groot Dreams,人类给一次示范,让机器人做10000次梦,然后掌握这项技能。
无法不在场的中国大陆
在黄仁勋的规划里,“AI工厂”将遍及每个地区、每个行业、每个国家、每个公司。这是下一场AI竞争的开始。当然也包括中国市场。没有中国的“AI工厂”是大打折扣的。
在演讲中,他没有太多提及中国大陆。但演讲结束后,黄仁勋在与科技博客Stratechery作者Ben Thompson对谈中称,最近,特朗普政府废除AI扩散禁令,重新开放,着手“收复”中东市场,对过去美国政策消极影响的修复不及50%,而只是10%,如果不进入中国市场,另外90%都将无从实现。