AIGC开放社区
发布于

国产GPU芯动科技发布最新芯片,单卡直接堆上了112GB以上的超大显存

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!

刚刚,芯动科技发布了“风华3号”,单卡直接堆上了112GB以上的超大显存。

“风华3号”是芯动科技“风华”这个GPU家族的最新成员。在它之前,还有两位兄长探过路。

“风华1号”,2021年问世,是中国第一款能用于数据中心的4K级别智能渲染GPU。单精度浮点算力是5TFLOPS,用两颗“风华1号”芯片做出来的显卡,性能可以对标英伟达的T4。显存方面,它用了当时很先进的GDDR6/GDDR6X技术,最大容量16GB。

“风华2号”,2022年登场,主攻桌面市场。它是国内第一款能支持4K三屏显示的高清桌面GPU,性能大概和英伟达的GTX 1050差不多。别小看这个性能,对于很多办公和国产化替代场景来说,已经相当够用。

9月22日,芯动科技在珠海正式发布了“风华3号”全功能GPU。

很多用于服务器的GPU,其实是GPGPU(通用计算图形处理器),阉割了图形和显示功能。而全功能GPU,计算、图形渲染、视频编解码、多屏显示这些活儿全都能干,架构更复杂,门槛自然也更高。

它有六个特别亮眼的地方。

国内首款把国产RISC-V(一种开放指令集架构)CPU和兼容CUDA的GPU集成在一起的芯片。

全球第一款原生支持DICOM(医学数字成像和通信)高精度灰阶显示的GPU。

国内第一款单卡配备112GB以上大显存,并且核心IP全自研的全功能GPU。

国内第一款支持光线追踪的8K渲染GPU。

国内第一款支持YUV444无损编码的GPU。

打通了“计算+存储+连接”,构建了国产GPU的第一个完整生态。芯动科技不只发布了GPU,还展示了自家的高端DDR5内存模组和PCIe5服务器交换芯片。

它的FP32性能达到了78 TFLOPS,这个算力足以应对大模型训练和复杂的科学计算。

显存配置是112GB以上的高带宽显存。这让它单卡就能跑得动320亿或720亿参数的大模型;如果一台服务器装上八张卡,更是能直接驱动像DeepSeek 671B/685B这种级别的巨型模型。

渲染方面,它支持8K分辨率下的光线追踪,兼容DirectX12等主流图形接口。在运行CAD工业软件时,性能达到了国际主流水平,玩《古墓丽影》这样的3A游戏也不在话下。

显示和编码能力上,一张卡可以同时带动6个8K分辨率的屏幕,并且支持前面提到的YUV444无损编码。

生态兼容性上,它支持PyTorch、CUDA、Triton等主流AI计算生态,也支持DirectX、OpenGL、Vulkan等渲染生态,还能适配国内外各种操作系统。

国产GPU正在奋起直追,路越走越宽了。

参考资料:

https://www.innosilicon.com.cn/gpu

https://www.fantasyxpu.com/product/g3

浏览 (20)
点赞
收藏
1条评论
探小金-AI探金官方🆔
大家好,探小金来啦~🎉今天AIGC开放社区的作者AIGC大大分享了芯动科技的新成果——“风华3号”GPU超级芯片!🌟这不仅是国内首款112GB大显存的全功能GPU,更是RISC-V与CUDA的完美结合,而且支持8K渲染和DICOM高精度显示!🔥 让我们为中国自主研发的GPU点赞!想象一下,这技术对AI训练和工业设计领域的革命性影响啊!🌈 你对这样的GPU生态怎么看呢?快来讨论下,未来的计算世界会是什么模样?🚀 #芯动科技风华3号# #国产GPU崛起#
点赞
评论