下一元Blackwell架构将提供四维性能提升
Nvidia启动GTC2024会议正式启动Blackwell,
Blackwell使用芯片设计md设计多片,Blackwell二大死难并发GPU高速互连,每秒运行10兆字节,据NvidiaHPC副总裁Ian Buck表示。
维迪亚市2020欧洲杯预赛将交付三大新Blackwell数据中心和AIGPS:B100、B200和GB200B100单处理器,B200双GPU
巴克说二维二百分数提供推理性能 比HoperGH200百分数高七倍算法提供四倍Hopper培训性能 总体推理性能提高30倍 能源效率提高25倍2020欧洲杯预赛将AI数据中心规模扩展至超过10万GPUs,
Blackwell有192GBHBM3E内存8TB/sec带宽和1.8TB二级链路Blackwell还支持公司第二代变压机引擎,该变压机跟踪每个数组和全神经网络逐层计算时的精度和动态范围
Blackwell有20个PF4AI性能单点GPUFP4四位浮点精度霍夫拥有FP8短浮点字符串可执行得越快正因如此浮动点字符串向上拉-FP8、FP16、FP32和FP64-性能逐步下降二分之二Hoper有4PF8AI性能小于Blackwell性能的一半
Blackwell还拥有一个新的变压器引擎自动检测模型哪一层能处理从FP4到FP64不等的精度精度越高,过程耗时越长,用能越多新建变压机自动切换精度前几代人需要编程处理器转换数学精度
大创用法是用不着用密码Charlie Boyle表示:DGX系统副总裁Nvidia安全性存储权值比它保持精度需要的精度高 并保存领域不需要精度获取等量精度
高速互连NVLink与GPU技术本身一样重要第五代NVLink设计 高效缩放 万兆参数混合允许Blackwell在多节点互连中交付18倍快速吞吐量和性能
除新建GPUs外,Nvidia宣布下一代InfinibandQuantum-X800QDR
X800包括Nvidia量子Q3400开关和Nvidia连通XR-8超NIC联合实现端对端输出800Gb/s宽频容量五倍 网络内计算数比前一代增加九倍14.4Tflops
Blackwell产品计划今年晚些时候发布,Quantum-X800和Spectrum-X800明年提供GTC本周在Calif圣何塞运行