未尽研究
发布于

黄仁勋台北宣布NVlink Fusion,以软件生态主动兼容国产芯片的想象


黄仁勋脱下了西装,又穿上了皮衣,从北京、华盛顿、中东之行,回到了他最熟悉和拿手的科技主场。

在台北的Computex大会上,黄仁勋一如继往变戏法式地推出一堆AI概念和产品。但如果五年后回望,宣布NVLink Fusion,也许是黄仁勋这场演讲对整个AI行业影响最为深远的一刻。用生态去叠加地缘,这里面可以有演变。

NVLink Fusion,向AI世界工厂开放

NVLink是英伟达自研高速互联技术,通过提升网络通信功能,将过去数据中心中一堆各自运转的GPU,变成一个统一的GPU。这正是英伟达之前5年的关键任务。与PCIe 5.0(128 GB/s)相比,它提供的带宽高出14倍。但它之前只服务于自己的AI生态。

黄仁勋正在将“AI工厂”视为下一个5年的关键。在这场产业变革中,每家“AI工厂的任务各不相同,所需AI基础设施的最优配置,也可能略有不同。英伟达决定适度开放,允许客户半定制自己的“AI工厂,选择将自己的CPU与英伟达的GPU一起使用,或将英伟达的GPU与其他定制AI芯片一起使用。甚至,定制AI芯片都不一定非得是用来加速transformer架构模型的。

NVLink Fusion为新玩家打开了AI生态系统,尤其是要在ASIC芯片市场中要占有一席之地。不过,英伟达可能也要冒着降低市场对其产品需求的风险。

对于正在抓紧研发自己的AI芯片的云服务商,以及联手支持竞争方案UAlink的英特尔与AMD而言,这是英伟达的一次主动出击。理论上,它可以让谷歌TPU、亚马逊Trainium、微软MaiaMETAMTIA,无缝融入自己的“AI工厂,包括CUDA生态以及更多软硬件技术栈。

对于中国而言,英伟达的NVLink Fusion生态,具备另一层想象力。到目前为止,美国对中国的芯片禁令,主要围绕GPU算力与HBM内存,并没有明文禁止NVLink通信性能。目前传闻中的英伟达为中国市场新款定制的合规芯片、以及传闻中的要在上海建一处研发中心,都和NVlink Fusion生态发生了某种关联的可能。

半开放的NVLink Fusion,其核心价值不仅仅是英伟达的GPU——谷歌的TPU的总拥有成本比它更低——更在于其围绕GPU构建起来的CUDA生态,以及目前正在打造的更广泛的软件技术栈。对于市场份额远低于英伟达的其他硬件厂商,尤其是中国芯片厂商来说,接入更为成熟的CUDA生态,是充满诱惑的“解药”,有效果,也有副作用。

联发科与Marvell等已经决定使用该技术构建定制AI芯片,富士通与高通已经计划使用该技术构建定制CPU。博通、英特尔和AMD目前都不在名单上,可能永远也不会。

从云到端,从硅谷到台北

这也是为什么,与去年的夜场不同,黄仁勋这次选择了早场,即使它对硅谷投资者并不友好。他有意无意地,绕开了硅谷的云服务商,特意捧了一下东道主的中国台湾。

AI已经不仅仅是技术趋势还是产业趋势,包括中国台湾在内的亚洲,世界工厂集聚密度最高,是“AI工厂”诞生的重要市场;它的很多供应链上下游企业也都在这里,需要就下一个5年的路线图,也就是“AI工厂”,达成共识。

英伟达的上一个五年计划,始于2019年收购Mellanox。通过重构网络通信,英伟达将整个数据中心,转换成一个计算单元,去完成同一个任务,预训练。现在,轮到工厂了。“AI 工厂,正在全球各地陆续上线,它的价值将以每小时产出多少 token”来衡量,也就是员工与智能体协作,围绕公司业务展开推理。

英伟达的“AI工厂,首先以云端的大规模集群的形态实现,然后,被黄氏定律压缩到只需要一根电源线连接到家里墙上的插座即可。

AI工厂的部署权,逐步下沉至个人开发者。在今年CES发布的Spark(当时的Project Digits),是可以放进书包里的个人“AI工厂,约1petaflops的算力性能,等效于2016年发布的上百公斤重的DGX1。在Spark遭遇苹果Mac Studio阻击后,今天,黄仁勋又更新了产品线,拿出了可以运行1T规模参数的DGX Station20petaflop算力和800GB内存,仅一台就相当于6年前18000Volta架构GPU构建的集群。

企业与工厂,得到了RTX Pro算力平台。黄仁勋实在太喜欢横空出世的DeepSeek了,再次将R1模型的表现放到性价比(兼顾单位时间token吞吐能耗与单用户推理速度)最优函数上,每花费500万美元,RTX PRO的性价比是H100的四倍。黄仁勋说,自己的所有合作伙伴,正在规模量产RTX Pro。这不禁让人回想起今年年初以来,中国突然爆发的一体机市场。

在黄仁勋的“AI工厂的叙事里,还有新面孔“IQ”Intelligent Query),是专为AI 优化的非结构化语义数据平台,让“AI工厂更懂自己企业,让GPU的推理更有效地产出token;以及Groot Dreams,人类给一次示范,让机器人做10000次梦,然后掌握这项技能。

无法不在场的中国大陆

在黄仁勋的规划里,“AI工厂将遍及每个地区、每个行业、每个国家、每个公司。这是下一场AI竞争的开始。当然也包括中国市场。没有中国的“AI工厂是大打折扣的。

在演讲中,他没有太多提及中国大陆。但演讲结束后,黄仁勋在与科技博客Stratechery作者Ben Thompson对谈中称,最近,特朗普政府废除AI扩散禁令,重新开放,着手收复中东市场,对过去美国政策消极影响的修复不及50%,而只是10%,如果不进入中国市场,另外90%都将无从实现。



浏览 (8)
点赞
收藏
1条评论
探小金-AI探金官方🆔
Hey小伙伴们!探小金来啦!在 Computex的舞台上,黄仁勋老总变身科技魔法师,宣布NVLink Fusion,这可是个超级大新闻哦!他不仅让自家的GPU与CPU共舞,还打算开放给更多AI新秀,包括国产芯片!想象一下,这不仅可能让ASIC市场的竞争更加激烈,更让中国的科技玩家们眼前一亮,似乎NVLink生态对国内有着特别的吸引力呢! 对于那些正在研发自家AI芯片的云巨头们,这可是个不小的战略挑战,就连英特尔和AMD也感受到了压力。而中国,嘿,机会来了!因为NVLink Fusion可能成为美国禁令下的一个例外,对于中国厂商来说,接入成熟、强大的CUDA生态,是不是就像找到了解药呢? 黄仁勋这次的选择也很有趣,从硅谷的夜场转向台北的早场,他不只是在谈技术,更是在编织全球的科技版图。AI不仅是技术,更是产业,亚洲,尤其是台湾,正成为这场“AI工厂”革命的重要舞台。 他的愿景里,从云端到家庭,从巨头到个人开发者,AI威力无处不在。我们期待着更多小到可以放进书包的“AI工厂”,比如
点赞
评论